COMPUTE#£d(^^ovanie /\РХIIЕ' sisteme informatice >- Perspectiva unui programator Randal E Bryant David R O'Hallaron i Prentice hali Pearson Education Inc Upper Saddle River, New Jersey UDC BBK B Bryant R , O'Hallaron D B Sisteme de calcul: arhitectură și programare Pe din engleza - Sankt Petersburg: BHV-Petersburg, - p : ill ISBN - - - Cartea se bazează pe cursul „Introduction to Computer Systems” elaborat de autori, predat în peste de universități din întreaga lume Descrie un sistem informatic, care se referă nu numai la „elementele standard ale arhitecturii”, cum ar fi procesorul central, memoria, porturile de intrare-ieșire etc , ci și sistemul de operare, compilatorul și mediul de rețea Sunt luate în considerare prezentarea datelor și a programelor la nivel de mașină, arhitectura procesorului, optimizarea programelor, controlul legăturilor și fluxului, managementul memoriei și memoriei virtuale, I/O la nivel de sistem, programarea în rețea și paralelă Este descris modul în care aspectele de mai sus trebuie să fie luate în considerare de către programator atunci când își dezvoltă propriile aplicații și sisteme Exemplele din carte pentru procesoare compatibile cu Intel ( A ) sunt scrise în C și rulează pe un sistem de operare Unix sau similar, cum ar fi Linux Pentru profesori, studenți și programatori UDC LBC Echipa de publicare: Redactor șef redactor șef editat Traducere din engleză Ekaterina Kondukova Igor Shishigin Grigory Dobin Dmitri Yezhov, Stanislav Shestakov Editor Coritor de corecturi pe computer Design coperta Cap producție Elena Kashlikova Olga Sergienko Zinaida Dmitrieva Igor Tsyrulnikov Nikolay Tverskikh Traducere autorizată din ediția în limba engleză, intitulată COMPUTER SYSTEMS: A PROGRAMMER'S PERSPECTIVE, Ediția I, ISBN - - -X, de BRYANT, RANDAL E și O'HALLARON, DAVID R , publicată de Pearson Education, Inc , publicând ca Prcntice Hali, Copyright © Drepturile AU rezervate Nicio parte a acestei cărți nu poate fi produsă sau transmisă prin orice fonii sau prin orice mijloace, electronice sau mecanice, inclusiv prin fotocopiere, înregistrare sau prin orice sistem de stocare a informațiilor, fără permisiunea Pearson Education, Inc Ediție în limba engleză publicată de BHV—St Petersbuis, Copyright © Traducere autorizată a ediției în limba engleză emisă de Prcntice Hali, Pearson Education, Inc , © Toate drepturile rezervate Nicio parte a acestei cărți nu poate fi reprodusă sau transmisă sub nicio formă sau prin orice mijloc, electronic sau mecanic, inclusiv fotocopiere și înregistrare pe suport magnetic, cu excepția cazului în care este autorizat de Pearson Education, Inc Traducere în rusă „BHV-Petersburg”, © ID licență nr din Semnat pentru publicare la mai Format хJu / v Imprimare offset Conv pfh l Tiraj exemplare Ordinul nr „BHV-Petersburg”, , St Petersburg, st Yesenina, B Concluzie sanitară și epidemiologică pentru produse Ne D din noiembrie emis de Serviciul Federal de Supraveghere a Protecției Drepturilor Consumatorului și Bunăstare Omului Tipărit din folii transparente gata făcute la Întreprinderea Unitară de Stat „Imprimeria” Nauka „ , Sankt Petersburg, linia , ISBN - - -X ISBN - - - (rusă) Din , Pearson Education, Inc , Pearson Prentice Hali O Traducere în rusă „BHV-Petersburg”, Cuprins Cuvânt înainte unul Ce trebuie să știți înainte de a citi Cum să citești o carte Originea cărții Prezentare generală a cărții Mulțumiri Informații despre autori nouă PARTEA INTRODUCERE PREZENTARE DE GENERALĂ A SISTEMELOR DE CALCULATE Capitolul Excursii în sisteme informatice Informația este biți + context Programe care sunt traduse de alte programe sub diferite forme Cum funcționează sistemul de compilare Procesoarele citesc și interpretează instrucțiunile stocate în memorie Organizarea hardware-ului sistemului Anvelope douăzeci Dispozitive I/O RAM PROCESOR Executarea programului hello Diferite tipuri de cache Dispozitivele de memorie formează o ierarhie Sistemul de operare controlează funcționarea hardware-ului Procese Fire treizeci Memoria virtuală Fișiere Comunicarea în rețele Pasii urmatori Rezumat Note bibliografice VI Cuprins PARTEA I STRUCTURA ȘI IMPLEMENTAREA PROGRAMULUI Capitolul Prezentarea și lucrul cu informațiile Stocarea informațiilor Sistemul numeric hexazecimal Despre conversia între zecimal și hexazecimal Cuvinte de mașină Dimensiunile datelor Adresarea și ordonarea octeților Despre denumirea tipurilor de date Imprimare formatată Pointeri și matrice Pointer și Dereferencing (Eliminarea Indirecției) Reprezentarea rândurilor Vizualizare cod Algebre și inele booleene La ce foloseşte algebrei abstracte Operații la nivel de biți în C Operații logice în C Operații de schimbare în C Reprezentare întreagă Tipuri întregi Semnat și codificări complementare pentru doi Conversii între numerele semnate și nesemnate Cantități semnate în raport cu cantitățile nesemnate din C Extinderea reprezentării pe biți a unui număr Trunchierea numerelor Aritmetică întregi Creștere nesemnată Creșterea a doi Negaţie complementară-binară Înmulțirea fără semn Înmulțirea în codul complementar al doi Înmulțirea cu puteri a două Împărțirea la puterile a doi Numere în virgulă mobilă Numere binare fracționare Reprezentare în virgulă mobilă IEEE Valori normalizate Valori nenormalizate Semnificaţii speciale Cifre aproximative Rotunjire Operații cu virgulă flotantă virgulă flotantă în C Aritmetică în virgulă mobilă Intel IA Rezumat Note bibliografice Cuprins VII Sarcini pentru soluția acasă Soluția exercițiului Capitolul Reprezentarea programelor la nivel de mașină Perspectivă istorică Codificarea programului Cod la nivel de mașină Exemple de coduri Nota de formatare Formate de date Accesul la date Specificatori de operanzi Comenzi de mișcare a datelor Mutarea datelor Câteva exemple de indicatoare Operaţii aritmetice şi logice Încărcați comanda adresa executabilă Operații unare și binare Operații în schimburi Discuţie Operații aritmetice speciale Control Coduri de control Accesarea codurilor de condiție Comenzile de salt și codificarea acestora Traducerea sărituri condiționate Cicluri bucle do-while bucle while pentru bucle Declaraţii de selecţie Proceduri Structura cadrului stiva Transferul controlului Convenții de registru Exemple de proceduri Proceduri recursive Alocarea memoriei pentru matrice și accesul la matrice Principii de bază i Operaţii aritmetice cu pointeri Matrice și bucle Bucle imbricate Matrice de dimensiuni fixe Matrice alocate dinamic Structuri eterogene de date Structuri Reprezentarea unui obiect ca structură de tip struct Asociaţii VIII Cuprins Alinierea Cum să folosiți pointerii Utilizarea GDB Debugger Referințe pentru celulele de memorie și depășiri de buffer Coduri în virgulă mobilă Registre cu virgulă mobilă Evaluarea expresiei utilizând stiva Operații de mutare și transformare a datelor Aritmetică în virgulă mobilă Utilizarea valorilor cu virgulă mobilă în proceduri Testarea și compararea valorilor în virgulă mobilă Încorporarea codurilor de asamblare în programele C „ Asamblator inline de bază Forma extinsă a instrucțiunii asm Rezumat Note bibliografice Sarcini pentru soluția acasă Rezolvarea exercițiilor Capitolul Arhitectura procesorului Y Arhitectura sistemului de comandă Design logic și limbaj de control Hardware HCL Gateway-uri logice Circuite de combinare şi expresii booleene HCL Circuite de combinare la nivel de cuvânt și expresii întregi în HCL Apartenența la un set Memorie și sincronizare Implementări secvenţiale ale lui Y Organizarea în etape a procesorului Probă Decodificare Performanţă Memorie Scriere înapoi Actualizare PC Executarea comenzii gmtoѵi Executarea comenzii pushl executarea comenzii je Executarea comenzii ret Structura hardware SEQ Probă Decodificare Performanţă Memorie Scriere înapoi SEQ Timing Cuprins IX Implementarea pașilor SEQ Etapa de eșantionare Pași de decodare și scriere inversă Faza de execuție Etapa memoriei Pasul de actualizare a PC-ului Studiu SEQ Reconfigurarea pașilor de calcul Principii generale ale conductelor Calculează conducte Descrierea detaliată a funcţionării transportorului Limitări de conducte ?? Compartimentare neuniformă Reducerea randamentelor prin pipeline profunde Conducta unui sistem în buclă închisă Implementări Y Pipeline Inserarea registrelor de conducte Reconfigurarea și reetichetarea semnalelor Prezicerea următoarei valori a PC-ului Riscuri de conductă Enumerarea claselor de risc în funcţie de date Cum să evitați riscurile legate de date cu oprire Cum să evitați riscurile legate de date prin promovare Riscuri în funcție de sarcină/utilizare Implementarea etapelor PIPE Etapa de selecție și eșantionare RS Pași de decodare și scriere inversă Faza de execuție Etapa memoriei Logica de control al transportorului Tratarea dezirabilă a cazurilor speciale de control Identificarea condiţiilor speciale de control Mecanisme de control al benzilor transportoare Combinații de condiții de control Implementarea logicii de control Analiza eficienţei Lucrare neterminată Gestionarea excepțiilor Comenzi multiple Asocierea cu un sistem de memorie Rezumat Y Simulatoare Note bibliografice Sarcini pentru soluția acasă Soluția exercițiului Capitolul Optimizarea performanței programului Oportunități și limitări ale compilatorului de optimizare Exprimarea performanței programului X Cuprins Exemplu de program Eliminarea ciclurilor insuficiente Reducerea apelurilor de procedură Eliminarea referințelor inutile la locațiile de memorie Descrierea generală a procesoarelor moderne Funcţionare generală Performanța dispozitivului funcțional O privire mai atentă asupra funcționării procesorului Traducerea comenzilor în operații Prelucrarea Operațiunilor de către Executant Planificarea operațiunilor cu resurse nelimitate Programarea operațiunilor cu constrângeri de resurse Combine Concluzii de performanță Reducerea supraîncărcării ciclului Conversia în cod pointer Creșterea concurenței Ruperea buclelor Înregistrare extrudare Limite de concurență Rezumatul optimizării codului de concatenare Anomalie de performanță numerică virgulă flotantă Schimbarea platformelor Previziune de ramură și penalități pentru predicție incorectă Înțelegerea performanței memoriei Întârzierea operațiunilor de încărcare Întârzierea operațiunilor de salvare Viața în lumea reală: tehnici pentru îmbunătățirea productivității Identificarea si eliminarea elementelor critice/performante Profilare program Utilizarea Profilerului pentru a gestiona optimizarea Legea lui Emdal Rezumat Note bibliografice Sarcini pentru soluție la domiciliu Soluția exercițiului Capitolul Tehnologii de stocare a informațiilor Memorie cu acces aleator RAM statică RAM dinamică DRAM-uri standard Module de memorie DRAM-uri extinse Memorie non volatila Accesarea memoriei principale Cuprins XI Unitate disc Geometria discului Capacitatea discului Funcționarea discului Blocuri logice de disc Discurile de evaluare Direcții de dezvoltare a tehnologiilor dispozitivelor de înregistrare Localitatea Localitatea de acces la datele programului Localitate de preluare a comenzii Rezumatul localității Ierarhia memoriei Memorarea în cache în ierarhia memoriei Apeluri reușite Pierderile de cache Tipuri de erori de memorie cache Gestionarea cache-ului Rezumatul conceptului de ierarhie a memoriei Tipuri de cache Organizarea cache-ului generic Direct Mapping Cache Selectarea unui set în memoria cache de cartografiere directă Potrivirea șirurilor în memoria cache de cartografiere directă Extragerea unui cuvânt în cache-urile mapate direct Evacuarea liniei în cazul erorilor directe ale memoriei cache afișaj Asamblare finală: cache cu acces direct în acțiune Conflicte ratate în memoria cache mapată directă Cache-urile asociate setului Selecția setărilor în cache-urile asociate setului Potrivirea șirurilor și extragerea cuvintelor în cache-urile multi-asociative Evacuarea liniei la rateuri în cache-urile multiasociative Cache-uri complet asociative Setați selecția în cache-urile asociative complet setate Potrivirea șirurilor și extragerea de cuvinte în întregime memoria cache-asociativă de set Lucrul cu operațiuni de scriere Cache-urile de instrucțiuni și cache-urile unificate Impactul setărilor cache-ului asupra performanței Efectul dimensiunii memoriei cache Influența dimensiunii blocului Influența asociativității Influența strategiei de scriere Scrierea codurilor pentru cache-friendly Impactul memoriei cache asupra performanței programului Muntele memoriei Reconfigurarea ciclurilor pentru îmbunătățirea localității spațiale Folosirea blocării pentru a mări localitatea temporală XII Cuprins Utilizarea localității în programe Rezumat Note bibliografice Sarcini pentru soluția acasă Soluția exercițiului PARTEA II RELAȚIUNEA PROGRAMELOR ÎN SISTEM Capitolul Editarea relațiilor Drivere pentru compilator Legătura statică Fișiere obiect Fişiere obiect relocabile Identificatori și tabele de nume Rezoluția legăturii Referințe globale definite multiple Conectarea cu biblioteci statice Utilizarea bibliotecilor statice In miscare Intrări de mișcare Mutarea referințelor la un nume Relocarea legăturilor cu adresare relativă pe PC Mutarea referințelor absolute Fișiere obiecte executabile Încărcarea fișierelor obiecte executabile Legătura dinamică cu biblioteci partajate Încărcarea și legarea cu biblioteci partajate din aplicații Cod program relocabil Legături către datele PIC Apeluri de funcții PIC Instrumente de gestionare a fișierelor obiect Rezumat Note bibliografice Sarcini pentru soluția acasă Rezolvarea exerciţiilor Capitolul Gestionarea excepțiilor Excepții Gestionarea excepțiilor Clasele de excepție Întreruperi hardware Întreruperi de sistem Eșecuri Capete anormale Excepții la procesoarele Intel Procese Fluxul logic de control Spațiu de adresă privat Cuprins XIII Moduri utilizator și privilegiate Comutatoare de context Apeluri de sistem și tratare a erorilor Managementul proceselor Obținerea unui proces D Procese de depunere a icrelor și de terminare Uciderea proceselor copilului Modificarea comportamentului implicit Verificarea stării de ieșire a unui proces de copil ucis Condiții de eroare Constante legate de funcţiile Unix Exemple Adormirea proceselor Încărcarea și rularea programelor pentru execuție Utilizarea funcțiilor pentru a lansa programe Semnale Terminologia semnalului Trimiterea semnalelor Grupuri de procese Trimiterea semnalelor de la tastatură Trimiterea semnalelor utilizând funcții Recepţionarea semnalelor Unele probleme de procesare a semnalului Procesare portabilă a semnalului Blocarea explicită a semnalelor Transferuri non-locale de control Organizarea managementului proceselor Rezumat Note bibliografice Sarcini pentru soluția acasă Soluția exercițiului Capitolul Măsurarea timpului de execuție a programului Trecerea timpului într-un sistem informatic Programarea procesului și întreruperile temporizatorului Trecerea timpului din punct de vedere al programului aplicativ Măsurarea timpului prin numărarea numărului de intervale Rolul sistemului de operare Citirea datelor de la temporizatoare Precizia cronometrului procesului Contoare de ceas Contoare de ceas în IA Măsurarea timpului de execuție a programului folosind contoare de ceas Efectul de comutare a contextului Memorarea în cache și alte efecte Diagrama de măsurare K-best Evaluare experimentală Setarea valorii K Compensarea întreruperii temporizatorului XIV Cuprins Calcul pe alte mașini Rezultatele observației Măsurarea ceasului în timp real : Protocolul de experiment O privire în viitor Implementarea Schemei de Măsurare K-best Sarcini pentru materialul acoperit Rezumat Note bibliografice Sarcini pentru soluția acasă Soluția exercițiului Capitolul Memoria virtuală Adresare fizică și virtuală Spațiu de adresă Instrument de stocare în cache Organizarea cache-ului în DRAM Tabelele de pagini Pagina este în DRAM Accesarea unei pagini lipsă Aranjament în pagină Din nou despre compactitatea amplasării Manipularea memoriei Simplificarea aspectului Partajare mai ușoară Simplificarea alocării memoriei Încărcare mai ușoară VM ca protector de memorie Traducerea adresei Integrarea cache-ului în memoria virtuală Accelerarea traducerii adreselor cu TLB Tabele de pagini pe mai multe niveluri Traducerea continuă a adreselor Sistem de memorie Pentium/Linux Traducerea adresei de către Pentium Tabelele de pagini din Pentium Traducerea tabelului de pagini în sistemul Pentium Conversie TLB pe un sistem Pentium Sistem de memorie virtuală Linux Zone de memorie virtuală în Linux Gestionarea excepției care apare la accesarea unei pagini lipsă pe un sistem Linux Afișajul memoriei Obiecte revăzute partajate Încă o dată despre funcția furcii Încă o dată despre funcția execute Maparea memoriei la nivel de utilizator cu funcții ttar Cuprins XV Alocarea dinamică a memoriei malloc și funcții gratuite Ce face alocarea dinamică a memoriei Scopul programului de alocare a memoriei și cerințele pentru acesta Fragmentarea Probleme de implementare Liste implicite gratuite Plasarea blocurilor distribuite Împărțirea blocurilor libere Obținerea memoriei dinamice adiționale Îmbinare blocuri gratuite Combinarea utilizând etichete de delimitare Implementarea unui program simplu de alocare a memoriei Dezvoltarea unui program de alocare a memoriei Constante de bază și definiții macro pentru control lista de blocuri libere Crearea unei liste inițiale de blocuri gratuite Eliberarea și îmbinarea blocurilor Selectarea blocului Liste explicite gratuite Liste gratuite separate Partajare simplă a memoriei Împărțirea după mărime Metoda dublă Colectarea gunoiului Principii de bază ale programelor de colectare a gunoiului Programe de colectare a gunoiului care implementează algoritmul Mark&Sweep Algoritm conservator Mark&Sweep pentru programele C Erori frecvente Dereferențiarea indicatoarelor proaste Citirea unei zone de memorie neinițializată Stivă Buffer Overflow Indicator și dimensiunea obiectului Erori de subestimare sau supraestimare pe unitate Referirea unui pointer în loc de un obiect Înțelegerea greșită a operațiilor aritmetice deasupra indicatoarelor Referiri la variabile inexistente Referință la datele din blocurile heap libere Înțelegerea pierderilor de memorie Rezumatul unor concepte cheie legate cu memorie virtuală Rezumat Note bibliografice Sarcini pentru soluția acasă Soluția exercițiului XVI Cuprins PARTEA III INTERACȚIUNEA ȘI RELAȚIILE PROGRAMELOR Capitolul Nivelul I/O sistem I/O Unix Deschiderea și închiderea fișierelor Citirea și scrierea fișierelor Citirea și scrierea consecventă cu pachetul RIO Funcții de intrare și ieșire fără tampon RIO Funcții buffer de intrare RIO Citirea metadatelor fișierului Partajarea fișierelor Redirecționarea datelor I/O I/O standard Asamblare finală: ce funcții I/O ar trebui să utilizați? Rezumat Note bibliografice Sarcini pentru soluția acasă Soluția exercițiului Capitolul Programarea în rețea Model de programare client-server Retele de calculatoare Rețea globală Internet Adrese IP Nume de domenii de pe Internet Conexiuni la Internet Interfață socket Structuri de adrese de socket funcția priză funcția de conectare Funcția open cliențfd Funcția de legare Funcția de ascultare Funcția listenfd accept funcția Exemple de client Echo și server Echo Servere web Bazele web Conţinut web Tranzacții HTTP Solicitări HTTP Răspunsuri HTTP Difuzarea de conținut dinamic Cum transmite clientul argumentele programului către server Cum transmite serverul argumentele procesului generat Cum transmite serverul alte informații procesului generat Unde își trimite procesul generat rezultatul Cuprins XVII Dezvoltarea unui server web mic TINY Program de tip server TINY trebuie să funcţioneze funcţia clienterror Funcția read requestdrs funcția parse uri serve functie statica serviciu-functie dinamica Rezumat Note bibliografice Sarcini pentru soluția acasă Soluția exercițiului Capitolul Programare paralelă cu procese Server paralel bazat pe proces Avantaje și dezavantaje ale utilizării proceselor Programare paralelă cu multiplexare I/O Server paralel bazat pe evenimente Multiplexarea I/O Avantaje și dezavantaje ale multiplexării I/O Programare paralelă cu fire Model de execuție a firelor Fire de interfață a sistemului de operare Posix Crearea thread-urilor Încheierea firelor de execuție Separarea firelor Inițializarea fluxului Server paralel bazat pe fire Variabile partajate în programele cu fire de execuție Model de memorie pentru fire Maparea variabilelor la memorie Variabile partajate Sincronizarea firelor cu semaforele Ordinea comenzilor pentru prima iterație a buclei Grafice avansate Utilizarea semaforelor pentru a accesa partajate variabile Semafoare Posix Utilizarea semaforelor pentru a programa partajarea resurse Server paralel bazat pe pre-organizare procesare in-line Alte probleme de concurență Siguranța firului Clasa : funcții care nu protejează variabilele partajate Clasa : funcții care mențin starea pe mai multe apeluri XVIII Cuprins Clasa : Funcții care returnează un pointer către o variabilă statică Clasa : funcții care numesc thread-unsafe funcții Reintrare Utilizarea funcțiilor de bibliotecă existente în programele în flux Rasă Deadlock (deadlocks) Rezumat Note bibliografice Probleme pentru rezolvarea la domiciliu Rezolvarea exerciţiilor APLICAȚII Anexa Descrierea logicii de control a procesoarelor care utilizează HCL Ghid de ajutor HCL Declararea semnalelor Textul între ghilimele Expresii și blocuri Exemplu HCL Descriere SECV Descrierea SEQ+ Transportor Anexa Tratarea erorilor Gestionarea erorilor pe un sistem Unix Gestionarea erorilor în stil Unix Gestionarea erorilor de stil Posix Gestionarea erorilor în stil DNS Rezumatul funcțiilor de raportare a erorilor Programe de tratare a erorilor de interfață Programe de tratare a erorilor în stil Unix Programe de tratare a erorilor în stil Posix Manipulatorii de erori de stil DNS Fișier antet csapp h Fișier sursă csapp c Bibliografie Index Soțiilor noastre, Janice și Helen, și copiilor noștri, Jacob, Claire, Elizabeth, Mihail, Iosif, Ioan și Nicolae cuvânt înainte Această carte este destinată programatorilor care doresc să-și îmbunătățească abilitățile învățând ceea ce se întâmplă „sub capota” unui sistem informatic Scopul autorilor este de a încerca să explice conceptele stabile care stau la baza tuturor sistemelor informatice, precum și să demonstreze tipurile specifice de influență a acestor idei asupra corectitudinii, performanței și proprietăților utile ale unei aplicații software Spre deosebire de alte cărți dedicate sistemelor informatice și scrise în primul rând pentru creatorii acestora din urmă, materialul propus este destinat exclusiv programatorilor și este considerat din propriile poziții Studierea și înțelegerea temeinică a conceptelor prezentate în carte va permite cititorului să devină în cele din urmă un tip rar de „programator puternic” care cunoaște esența a ceea ce se întâmplă și este capabil să rezolve orice problemă Acest lucru va pune bazele studiului unor subiecte specifice precum lucrul cu compilatoare, arhitectura sistemului de computer, sistemele de operare și rețelele Ce trebuie să știi înainte de a citi Exemplele din această carte se bazează pe procesoare compatibile cu Intel (numite oficial IA sau x în viața de zi cu zi) care rulează programe C pe sau sunt compatibile cu un sistem de operare Unix (cum ar fi Linux) Pentru a simplifica prezentarea, termenul Unix va fi folosit în cele ce urmează pentru a se referi la sisteme precum Solaris și Linux Textul conține numeroase exemple de programare compilate și rulate pe sisteme Linux Autorii presupun că cititorii au acces la computere de acest fel Dacă computerul dvs rulează Microsoft Windows, puteți selecta oricare dintre următoarele opțiuni Puteți descărca o copie a Linux (www linux org sau www redhat com) și o puteți instala ca un al doilea sistem de operare, astfel încât mașina să poată rula oricare dintre cele două sisteme Ca alternativă, instalând setul de instrumente Cygwin (www cygwin com) pe Windows, puteți obține un shell asemănător Unix Cu toate acestea, nu toate caracteristicile Linux sunt disponibile în Cygwin cuvânt înainte De asemenea, presupune că cititorul este familiarizat cu C sau C++ Dacă întreaga experiență a programatorului se limitează la lucrul cu Java, tranziția va necesita mai mult efort din partea acestuia, dar autorii vor oferi toată asistența necesară Java și C au o sintaxă comună și instrucțiuni de control Cu toate acestea, există aspecte ale C (în special pointerii, alocarea explicită a memoriei dinamice și I/O formatate) pe care Java nu le are Din fericire, C nu este un limbaj foarte complex și este descris frumos și cuprinzător în textul clasic de Brian Kernighan și Dennis Ricci [ ] Indiferent de cunoștințele de programare ale cititorului, se recomandă ca această carte să fie considerată o parte esențială a bibliotecii Capitolele inițiale ale cărții tratează interacțiunea dintre programele scrise în C și omologii lor în limbajul mașină Toate exemplele scrise în limbajul mașină au fost create folosind compilatorul GNU GCC bazat pe procesorul Intel A Nu se presupune că există experiență anterioară cu hardware, limbaje de mașină sau programare în limbaj de asamblare C Sfaturi privind limbajul de programare Pentru a ajuta cititorii cu o înțelegere mică sau deloc a programării C, autorii furnizează note ca aceasta pentru a evidenția caracteristici de importanță deosebită pentru C Se presupune că cititorii sunt familiarizați cu C++ sau Java Cum să citești o carte Din punctul de vedere al unui programator, a învăța cum funcționează în principiu un sistem informatic este foarte interesant, în principal pentru că se întâmplă rapid De îndată ce se învață ceva nou, îl puteți verifica imediat și puteți obține rezultatul, după cum se spune, direct De fapt, autorii consideră că singura modalitate de a învăța despre sisteme este crearea acestora: fie prin rezolvarea unor exerciții specifice, fie prin scrierea și executarea programelor în sisteme reale Sistemul este subiect de studiu pe parcursul întregii cărți Atunci când în text este prezentat un nou concept, se oferă o ilustrare cu una sau mai multe probleme practice pe care ar trebui să încercați imediat să le rezolvați pentru a verifica înțelegerea corectă a celor de mai sus Soluțiile exercițiilor sunt la sfârșitul fiecărui capitol Pe măsură ce vă familiarizați cu materialul, încercați să rezolvați singur toate problemele practice și apoi verificați corectitudinea căii alese La sfârșitul fiecărui capitol sunt prezentate și teme pentru acasă de diferite dificultăți Pentru fiecare sarcină acasă, este prezentată o evaluare a costurilor mentale și a altor costuri necesare: ♦ - Va dura doar câteva minute pentru a rezolva Este necesară o programare minimă (sau deloc) ♦♦ - va dura aproximativ de minute pentru a se rezolva Adesea necesită scrierea și testarea codurilor Multe dintre ele sunt derivate din sarcinile prezentate în exemple Cuvânt înainte ♦♦♦ - necesită un efort semnificativ; poate dura până la ore De regulă, include scrierea și testarea majorității codului ♦♦♦♦ este un laborator care durează până la ore Fiecare exemplu de cod din text este auto-formatat (fără lucru manual) dintr-un program C compilat cu versiunea GCC și testat pe un sistem Linux cu un nucleu Tot codul sursă este disponibil la csapp cs cmu edu Note și observații Notele servesc mai multor scopuri Unele sunt mici excursii istorice De exemplu, de unde au venit C, Linux și Internetul? Alte observații au scopul de a clarifica orice concepte De exemplu, care este diferența dintre un cache, un rând și un bloc? Replicile de al treilea tip descriu exemple „din viață” De exemplu, cum o eroare în virgulă mobilă a distrus o rachetă franceză sau care este geometria unei adevărate unități de disc IBM Și, în sfârșit, unele rânduri sunt doar comentarii amuzante Originea cărții Cartea a luat naștere dintr-un curs introductiv dezvoltat la Universitatea Carnegie Mellon (UCM) în toamna anului [ ] De atunci, cursul a fost predat în fiecare semestru; audiența a fost de până la de studenți ai Facultății de Informatică Acest curs a devenit o condiție prealabilă pentru majoritatea cursurilor avansate de sisteme informatice de la Universitatea Carnegie Mellon Ideea a fost de a prezenta elevilor computerele într-un mod ușor diferit decât în mod obișnuit Puțini studenți ar fi capabili să construiască singuri un sistem informatic Pe de altă parte, majoritatea studenților și chiar inginerilor informatici li se cere să folosească computerele zilnic în programare Prin urmare, principiul autorilor acestei cărți a fost de a începe să învețe cum să lucrezi cu sistemele din punctul de vedere al unui programator, folosind următorul filtru particular: un subiect va fi tratat numai dacă este legat de performanță, corectitudine sau proprietăți utile ale programelor C la nivel de utilizator De exemplu, subiectele legate de aditoarele hardware și designul magistralei sunt excluse La rândul său, cartea include subiecte despre limbajul mașinii, cu toate acestea, în loc de o discuție detaliată a limbajului de asamblare, accentul este pus pe construcția de pointeri, bucle, apeluri de procedură și returnări în limbajul C, iar instrucțiunile select sunt traduse de către compilatorul Mai mult, este nevoie de o viziune mai amplă și mai realistă atât a sistemelor hardware, cât și a software-ului, acoperind subiecte precum conectarea, încărcarea, procesele, semnalele, optimizarea eficienței, măsurătorile, I/O și programarea în rețea și paralelă Această abordare a făcut posibil ca cursul să fie practic, vizual și extrem de interesant pentru studenți Răspunsul acestuia din urmă și al colegilor de facultate cuvânt înainte tetu a fost imediată și pozitivă, iar autorii cărții și-au dat seama că profesorii din alte instituții de învățământ vor putea profita de evoluțiile lor Aceasta a fost condiția prealabilă pentru apariția acestei cărți, scrisă pe parcursul a doi ani pe notele de curs ale cursului Numerologie HQS Numerologia cursului VKS este ușor neobișnuită Cândva, la mijlocul primului semestru, autorii și-au dat seama că numărul atribuit cursului ( - ) era și un cod poștal al Universității Carnegie Mellon; de aici și motto-ul: - - cursul care aprinde UKM! Întâmplător, versiunea originală a manuscrisului a fost tipărită pe februarie ( / / ) La prezentarea cursului la Conferința de Educație SIGCSE, discuția a fost programată în sala Iar versiunea finală a cărții are capitole Bine că nu suntem superstițioși! Recenzie de carte Cartea constă din capitole menite să acopere principiile de bază ale sistemelor informatice într-un mod cuprinzător: Capitolul „Excursie în sisteme informatice” Primul capitol descrie principalele idei și subiecte legate de sistemele informatice, examinând ciclul de viață al unui program simplu „hello, world” Capitolul „Reprezentarea informațiilor și lucrul cu aceasta” Descrie aritmetica computerizată, concentrându-se pe proprietățile reprezentărilor nesemnate și ale complementului a doi care contează pentru programatori Acest capitol discută reprezentarea numerelor și, prin urmare, intervalul de valori care poate fi programat pentru o anumită lungime a cuvântului Autorii discută impactul conversiilor de tip ale numerelor cu semn și fără semn, proprietățile matematice ale operațiilor aritmetice Pentru cititori, devine o revelație că suma (codul complementar) sau produsul a două numere pozitive poate fi negativă Pe de altă parte, aritmetica complementului a doi satisface proprietățile din inel și astfel compilatorul poate transforma înmulțirea printr-o constantă într-o succesiune de deplasări și adunări Autorii folosesc operații pe biți C pentru a ilustra principiile și aplicațiile algebrei booleene Formatul IEEE în virgulă mobilă este descris în ceea ce privește reprezentarea valorilor și proprietăților matematice ale operațiilor în virgulă mobilă O înțelegere absolută a aritmeticii computerizate este esențială pentru scrierea programelor de lucru Debordarea aritmetică este o sursă comună de erori de programare, dar puține cărți descriu proprietățile aritmeticii computerizate din punctul de vedere al programatorului Capitolul „Reprezentarea programelor la nivel de mașină” Autorii învață cum să citești limbajul de asamblare IA creat de compilatorul C Iată șabloanele de instrucțiuni de bază create pentru diferite structuri de control, cum ar fi instrucțiunile condiționate, buclele și instrucțiunile select De asemenea, are în vedere cuvânt înainte cinci implementarea procedurilor, inclusiv stivuirea, convențiile de utilizare a registrelor și trecerea parametrilor Acest capitol discută diferite structuri de date, cum ar fi structuri, uniuni și matrice, și cum să le accesați Studierea prevederilor acestui capitol ajută la creșterea nivelului profesional, deoarece există o înțelegere a reprezentării pe calculator a programelor în curs de creare Capitolul „Arhitectura procesorului” Acest capitol descrie porți combinatorii și secvențiale și apoi demonstrează cum aceste porți pot fi combinate într-un canal de date care execută un set de instrucțiuni IA simplificat numit „Y ” Capitolul începe cu o descriere a proiectului canalului de informații, care ulterior se extinde la un proiect de conductă în cinci etape Logica de control pentru proiectarea procesoarelor este descrisă în capitol folosind limbajul simplu de descriere hardware, HCL Design-urile hardware scrise în HCL pot fi compilate și combinate în simulatoare GPU Capitolul „Optimizarea performanței programului” Aici, autorii prezintă mai multe tehnici pentru îmbunătățirea performanței codului Totul începe cu transformările unui program independent de mașină Apoi se face o tranziție la transformări, a căror eficacitate depinde de caracteristicile mașinii țintă și ale compilatorului Este prezentat un model operațional simplu al acțiunilor procesorului Capitolul „Ierarhia memoriei” Sistemul de memorie pentru programatorii de aplicații software este una dintre cele mai „vizibile” părți ale unui sistem informatic Până acum, cititorii s-au bazat pe modelul conceptual al sistemului de memorie ca o matrice vectorială cu timpi de acces uniformi În practică, un sistem de memorie este o ierarhie de dispozitive de stocare de diferite capacități, prețuri și viteze Capitolul discută diferite tipuri de memorie, cum ar fi ROM și RAM, precum și parametrii geometrici și designul unităților de disc moderne existente, organizarea acestor dispozitive de stocare într-o ierarhie Autorii arată posibilitatea ierarhiei prin localitatea legăturilor Aceste idei sunt concretizate prin prezentarea unei viziuni unice asupra sistemului de memorie ca un „munte de memorie” cu „roci” de localizare locală și „pante” de localizare spațială, modul în care performanța aplicațiilor software poate fi îmbunătățită prin îmbunătățirea localizării lor temporale și spațiale Capitolul „Editarea legăturilor” Acest capitol descrie legăturile dinamice și statice, inclusiv conceptele de fișiere obiect relocabile și executabile, reprezentare simbolică, redistribuire, biblioteci statice, biblioteci partajate și cod non-pozițional De regulă, legarea nu este luată în considerare în majoritatea lucrărilor pe sisteme informatice, dar autorii au inclus-o în această carte din mai multe motive În primul rând, cele mai frecvente și frecvente erori întâlnite de studenți în timpul procesului de conectare sunt deosebit de comune în cazul pachetelor software mari În al doilea rând, fișierele obiect create de linkeri sunt legate de concepte precum încărcarea, memoria virtuală și alocarea memoriei cuvânt înainte Capitolul „Gestionarea excepțiilor” În acest capitol, modelul cu un singur program este împărțit prin prezentarea unui concept general de logică de control exclusivă: de la excepții și întreruperi hardware de nivel scăzut, la comutări de context între procese paralele, modificări bruște ale logicii de control cauzate de semnalizarea Unix și non- salturi locale în C care sparg structura neat stack Aceasta este partea cărții care introduce conceptele fundamentale ale procesului general Acesta arată modul în care programatorii pot folosi mai multe procese prin apeluri de sistem Unix Capitolul „Măsurarea timpului de execuție a programului” Acest capitol explică modul în care un computer calculează timpul (senzori de interval, contoare de cicluri și ceasuri de sistem), sursele de eroare când acești timpi sunt utilizați pentru măsurarea timpului și cum se utilizează aceste cunoștințe pentru a obține valori precise Din câte se poate aprecia, acesta este un material unic, care nu a fost niciodată prezentat sub nicio formă sistematizată Acest subiect este inclus deoarece necesită o înțelegere a limbajului de asamblare, a proceselor și a cache-urilor Capitolul „Memorie virtuală” Prezentarea de către autor a sistemului de memorie virtuală este menită să ofere o oarecare înțelegere a principiilor funcționării și caracteristicilor acestuia Dorim să învățăm cum diferite procese care rulează în același timp pot folosi aceeași gamă de adrese, pot partaja unele pagini, dar pot avea copii individuale ale altora De asemenea, descrie probleme legate de gestionarea și manipularea memoriei virtuale În special, se acordă atenție lucrului cu alocătorii de memorie, cum ar fi malloc-ul Unix și operațiunile gratuite Prezentarea acestui material are mai multe scopuri În primul rând, întărește conceptul că un spațiu de memorie virtuală este doar o matrice de octeți pe care un program îi poate împărți în diferite blocuri de memorie Materialul ajută la înțelegerea impactului programelor care conțin erori de acces la memorie, cum ar fi scurgerile și referințele invalide ale indicatorului În cele din urmă, mulți programatori își scriu propriile alocatoare de memorie, optimizate pentru cerințele și caracteristicile fiecărei aplicații particulare Capitolul „Nivel I/O sistem” Acest capitol acoperă elementele de bază ale I/O în sistemul Unix, cum ar fi fișierele și mânerele Autorii descriu partajarea fișierelor, cum funcționează redirecționarea I/O și accesarea fișierelor cu metadate De asemenea, a dezvoltat un pachet solid I/O cu tampon care gestionează corect unitățile scurte ale contului Acest capitol descrie biblioteca I/O standard și relația acesteia cu I/O Unix, concentrându-se pe limitările I/O standard care o fac nepotrivită pentru programarea în rețea În general, subiectele abordate în acest capitol sunt elementele de bază ale următoarelor două capitole despre programarea în rețea și paralelă Capitolul „Programarea în rețea” Rețelele sunt ca dispozitive de intrare-ieșire pentru programare, combinând multe dintre conceptele învățate de cuvânt înainte ea: procese, semnale, ordonarea octeților, alocarea memoriei și alocarea dinamică a stocării Acest capitol este doar o bucată subțire a subiectului global al programării în rețea, determinând studenții să scrie un server Web Capitolul descrie modelul client-server, care stă la baza tuturor aplicațiilor de rețea Autorii prezintă Internetul din punctul de vedere al unui programator și demonstrează cum se scrie un client și un server de Internet folosind interfața socket IP În cele din urmă, capitolul prezintă HTTP și dezvoltă o interfață iterativă simplă Capitolul „Programare paralelă” Acest capitol prezintă studenților principiile programării paralele folosind proiectul Intemet-server ca exemplu de lucru Autorii compară și contrastează trei mecanisme de bază utilizate în scrierea programelor paralele: procese, compactare I/O și fluxuri și arată posibilitatea de a le utiliza atunci când se creează servere de lntemet paralele De asemenea, descrie principiile de bază ale sincronizării folosind operațiunile semaforului P și I, siguranța firelor și reintrența și blocajul Mulțumiri Suntem extrem de recunoscători tuturor prietenilor și colegilor pentru criticile lor serioase și pentru sprijinul din inimă Mulțumiri speciale studenților de la cursul - , a căror energie și entuziasm „ne țin uscați” Pachetul malloc a fost oferit cu amabilitate de Nick Carter și Vinnie Furia Guy Blallock, Greek Kesden, Bruce Maggs și Todd Maori au predat cursul timp de mai multe semestre, iar sprijinul lor neprețuit ne-a ajutat să îmbunătățim constant materialul prezentat Suntem datori lui Herb Derby pentru îndrumarea spirituală și asistența constantă în timpul muncii Alan Fisher, Garth Gibson, Thomas Gross, Seisha, Peter Steenkiste și Hugh Zhang ne-au dat impulsul să începem să lucrăm la materialul cărții Propunerea lui Garth „a pornit volantul” a fost susținută și elaborată cu atenție de echipa lui Alan Fisher Mark Stehlik și Peter Lee au oferit un sprijin neprețuit în organizarea acestui material în conformitate cu programa Greg Kesden a oferit feedback util care descrie impactul CS asupra cursului OS Greg Ganger și Jiri Schindler au oferit cu amabilitate câteva specificații ale unităților și au răspuns la întrebările noastre despre unitățile actuale Tom Stricker ne-a arătat „muntele memoriei” James Howe a oferit idei utile despre cum să prezinte materialul arhitecturii procesorului Grup de studenți - Khalil Amiri, Angela Demke Brown, Chris Colohan, Jason Crawford, Peter Dinda, Julio Lopez, Bruce Lowkamp, Jeff Pierce, Sanjay Rao, Balaji Sarpeshkar, Blake Scholl, Sanji Seshia, Greg Stefan, Tiankai Tu, Kip Walker și Yinglein Jie au ajutat la dezvoltarea conținutului cursului În special, Chris Colohan a dezvoltat un stil de prezentare distractiv (și amuzant) care este folosit și astăzi și a dezvoltat legendara „bombă binară” care s-a dovedit a fi un instrument excelent pentru predarea codului mașinii și conceptele de depanare opt cuvânt înainte Chris Bauer, Alan Cox, Peter Dinda, Sandia Duarkadis, John Grainer, Bruce Jacob, Barry Johnson, Don Heller, Bruce Lowkamp, Greg Morrissette, Brian Noble, Bobby Othmer, Bill Pugh, Michael Scott, Mark Smaterman, Greg Stefan și Bob Wyer A petrecut mult timp citind schițele cărții Mulțumiri speciale lui Al Davis (Universitatea din Utah), Peter Dinda (Universitatea de Nord-Vest), John Grainer (Universitatea Rice), Wei Su (Universitatea din Minnesota), Bruce Lowkamp (William și Mary), Bobby Othmer (Universitatea din Minnesota), Michael Scott (Universitatea din Rochester) și Bob Wyer (Colegiul Rocky Mountain) pentru testarea beta pentru calitatea de membru al clasei De asemenea, un mare mulțumire tuturor elevilor lor! De asemenea, vrem să le mulțumim colegilor noștri de la Prentice Hall Marsha Horton, Eric Frank și Harold Stone au oferit sprijin neclintit pe tot parcursul procesului În același timp, Harold a ajutat la descrierea cu acuratețe a faptelor istorice privind crearea arhitecturilor procesoarelor RISC și C SC Jerry Ralia a studiat materialul în profunzime și ne-a învățat multe în ceea ce privește prezentarea literară a textului În cele din urmă, aș dori să-mi exprim recunoștința scriitorilor tehnici Brian Kernighan și regretatului W Richard Stevens pentru că ne-au demonstrat că literatura tehnică poate fi scrisă frumos Multumesc mult tuturor RANDY BRYANT DAVE O'HALLARON Informatia autorului Randal E Bryant și-a primit diploma de licență de la Universitatea din Michigan în , după care a continuat să studieze la Institutul de Tehnologie din Massachusetts În , a primit un doctorat în teoria mașinilor și sistemelor de calcul Timp de trei ani a lucrat ca profesor asistent la Institutul de Tehnologie din California; s-a alăturat facultății de la Carnegie Mellon în În prezent este decan al departamentului de informatică de la Universitatea Carnegie Mellon (Pittsburgh) De de ani predă cursuri de informatică atât pentru studenți, cât și pentru absolvenți De-a lungul anilor în care a urmat cursuri de arhitectură computerizată, Randal Bryant și-a mutat treptat atenția de la modul în care funcționează computerele la modul în care programatorii puteau scrie programe mai eficiente și mai fiabile printr-o mai bună înțelegere a sistemului Împreună cu profesorul O'Hollaron, a dezvoltat curriculumul „Introducere în sistemele informatice” la Universitatea Carnegie Mellon, care stă la baza acestei cărți De asemenea, a predat cursuri de algoritmi și programare Cercetarea profesorului Bryant este legată de proiectarea instrumentelor software pentru a ajuta proiectanții de hardware să verifice corectitudinea sistemelor pe care le construiesc Aceasta include mai multe tipuri de simulatoare, precum și instrumente de verificare formală care dovedesc corectitudinea proiectării prin metode matematice A publicat peste de lucrări tehnice Rezultatele cercetării profesorului Bryant sunt utilizate de producători de calculatoare de top, inclusiv Intel, Motorola, IBM și Fujitsu El a primit numeroase premii de cercetare, inclusiv două premii de invenție, Premiul de realizare tehnică a Semiconductor Research Corporation, Premiul Kanellakis pentru Cercetare Teoretică și Practică Asociația pentru Mașini de Calcul (ACM), Premiul V R G Baker și Medalia Jubileului de Aur de la Institutul de Ingineri Electrici și Electronici (IEEE) Este angajat atât al ACM, cât și al IEEE În , David R O'Hollaron și-a luat doctoratul în informatică de la Universitatea din Virginia După ce a lucrat pentru General Electric, s-a alăturat facultății Carnegie Mellon în ca lector de sistem Informatia autorului temotehnica În prezent este profesor asociat la Departamentele de Informatică și Inginerie Electrică El a predat cursuri de licență și absolvent de sisteme informatice pe teme precum arhitectura computerelor și introducerea în sistemele computerizate, proiectarea procesoarelor paralele și internetul Împreună cu profesorul Bryant, a dezvoltat cursul „Introduction to Computer Systems” Profesorul O'Hollaron, împreună cu studenții săi, efectuează cercetări în domeniul sistemelor informatice În special, au dezvoltat sisteme software pentru oameni de știință și ingineri care simulează fenomene naturale Cel mai faimos exemplu al muncii lor este proiectul Quake, când o echipă de informaticieni, ingineri civili și seismologi au dezvoltat capacitatea de a prezice mișcările scoarței terestre, cutremure puternice, inclusiv cataclisme globale în sudul Californiei, Japonia, Mexic și New York Zeelandă Împreună cu restul proiectului Quake, profesorul O'Hollaron a primit medalia Allen Newell de la Universitatea Carnegie Mellon pentru contribuțiile remarcabile la cercetarea pe computer Punctul de referință pe care l-a dezvoltat pentru respectivul proiect equake a fost selectat de SPEC pentru a fi inclus în suita de programe SPEC CPU și OMP (Open MP) foarte influentă PARTEA INTRODUCERE Revizuirea computerului sisteme CAPITOLUL Excursie în sisteme informatice □ Informația este biți + context □I Programe care sunt traduse în diverse forme de către alte programe □ Cum funcționează sistemul de compilare □ Procesoarele citesc și interpretează instrucțiunile stocate în memorie □I Diverse tipuri de memorie cache □I Dispozitivele de memorie formează o ierarhie □I Sistemul de operare controlează funcționarea hardware-ului □ Schimb de date în rețele □I Următorii pași □ Reluați Un sistem informatic este format din hardware și software care interacționează pentru a asigura execuția programelor de aplicație Implementările specifice ale sistemelor se schimbă în timp, dar ideile din spatele lor rămân aceleași Toate componentele hardware și software care alcătuiesc sistemele de calcul și care îndeplinesc aceleași funcții sunt similare între ele Această carte este destinată programatorilor care doresc să-și îmbunătățească abilitățile prin obținerea unei mai bune înțelegeri a modului în care funcționează aceste componente și a impactului pe care îl au asupra funcționării corecte a programelor lor Ai o călătorie interesantă în față Dacă vă faceți timp pentru a studia conceptele prezentate în această carte, veți fi pe o cale care, în cele din urmă, vă va conduce să deveniți unul dintre puținii programatori profesioniști care au o înțelegere clară a modului în care funcționează sistemul informatic și a impactului pe care îl are asupra aplicațiile dvs paisprezece Parte introductivă Privire de ansamblu asupra sistemelor informatice Veți dobândi abilități speciale, de exemplu, cum să evitați erorile numerice ciudate cauzate de particularitățile modului în care numerele sunt reprezentate de un anumit computer Veți învăța cum să obțineți cod C optim prin aplicarea unor tehnici speciale care profită de caracteristicile procesoarelor și sistemelor de memorie moderne Veți obține o înțelegere a modului în care compilatorul implementează apelurile de procedură și a modului de utilizare a acestor cunoștințe pentru a evita găurile de securitate cauzate de eșecurile depășirii tamponului care interferează cu software-ul de rețea Veți învăța să recunoașteți și să evitați erorile urâte de editare a linkurilor care îi încurcă pe programatorii mediocri Veți învăța cum să vă scrieți propriile wrapper-uri, propriile pachete de alocare dinamică a memoriei și chiar și propriul dvs server Web! În cărțile lor clasice de programare C [ ], Kernighan și Ritchie își încep introducerea în limbajul de programare cu programul hello prezentat în Lista Și deși acesta este un program foarte simplu, totuși, toate părțile principale ale sistemului trebuie să funcționeze în comun pentru a-l duce la o finalizare cu succes Într-un sens, scopul acestei cărți este de a ajuta cititorul să înțeleagă ce se întâmplă și cum atunci când rulați programul hello pe sistemul dumneavoastră Începem studiul sistemelor urmărind programul hello de-a lungul vieții sale, din momentul în care un programator îl scrie și până în momentul în care este executat de sistem, tipărind mesajul său simplu și ieșire Deoarece acest program expiră, vom prezenta pe scurt conceptele de bază, terminologia și componentele care intră în joc În capitolele ulterioare, vom explora aceste concepte și idei mai detaliat Informația este biți + context Programul nostru hello începe viața ca un program sursă (sau fișier sursă) pe care programatorul îl creează cu un editor de text și îl salvează într-un fișier text numit hello c [ Listări Buna ziua #include int main() { printf("bună, lume\n"); } Programul sursă este o secvență de biți, fiecare dintre care ia valoarea sau , organizați în bucăți de biți numite octeți Fiecare octet reprezintă un anumit caracter al programului Capitolul cincisprezece Cele mai multe sisteme moderne reprezintă caractere text în standardul American Standard Code for Information Interchange (ASCII), care reprezintă fiecare caracter ca un întreg binar unic de opt cifre De exemplu, Lista arată reprezentarea ASCII a programului hello c Lista Reprezentarea fișierului text hello c în coduri ASCII r' # i n cu ude h > \n \n int \n P ri sau wor gcc -o hello hello c Aici, driverul compilatorului gcc citește fișierul sursă și îl traduce într-un fișier obiect executabil salut Această traducere are patru etape, prezentate în Figura Setul de programe care execută aceste patru faze (preprocesor, compilator, asamblator și linker) se numește sistem de compilare □ Etapa de preprocesor (sau faza de preprocesare) Preprocesorul (cpp) modifică programul sursă conform directivelor care încep cu simbolul # De exemplu, comanda #inciude de pe linia a hello c face ca preprocesorul să citească conținutul fișierului antet de sistem stdio h și să îl insereze direct în textul programului Rezultatul este un alt program C, de obicei cu un sufix i printf o Orez Sistem de compilare □ Etapa de compilare Compilatorul (cci) traduce fișierul text în fișierul text hello s, care conține programul în limbaj de asamblare Fiecare declarație dintr-un program în limbaj de asamblare descrie cu acuratețe una dintre instrucțiunile mașinii de nivel scăzut sub formă de text standard Limbajul de asamblare este util în primul rând pentru că oferă un limbaj de ieșire comun pentru compilatorii diferitelor limbaje de nivel înalt De exemplu, compilatoarele C și Fortran generează fișiere de ieșire în același limbaj de asamblare □ Etapa de asamblare Asamblatorul (as) traduce fișierul hello s în instrucțiuni în limbajul mașinii, le împachetează într-o formă cunoscută sub numele de program obiect relocabil și stochează rezultatul în fișierul obiect hello o Fișierul hello o este un fișier binar ai cărui octeți codifică instrucțiunile în limbajul mașinii, dar nu și caracterele Dacă am vizualiza fișierul cu un editor de text, am vedea o imagine complet de neînțeles □ Etapa de editare a linkurilor Rețineți că programul nostru hello apelează funcția printf din biblioteca de programe standard C, care este furnizată utilizatorului de fiecare compilator C Funcția printf rezidă într-un fișier obiect precompilat separat numit printf o, care într-un fel trebuie îmbinat cu hello o program Această îmbinare a realităților optsprezece Parte introductivă Privire de ansamblu asupra sistemelor informatice Setează editorul de linkuri (id) Rezultatul este un fișier hello, care este un fișier obiect executabil (sau pur și simplu un executabil) care este gata să fie încărcat și executat de sistem Despre proiectul GNU Gcc este unul dintre multele instrumente utile dezvoltate de Proiectul GNU (prescurtare de la GNU's Not Unix) Proiectul este o organizație de caritate scutită de taxe, începută de Richard Stallman în , cu scopul ambițios de a dezvolta un sistem complet, asemănător Unix, al cărui cod sursă nu este aglomerat cu restricții privind modul în care poate fi distribuit CPU În , proiectul GNU a dezvoltat un mediu Unix cu toate componentele majore ale sistemului de operare Unix, cu excepția nucleului, care a fost dezvoltat separat, și anume ca parte a proiectului Linux Mediul GNU include un editor emasc, un compilator GCC, un depanator GDB, un asamblator, un editor de linkuri, utilitare pentru manipularea fișierelor binare și alte componente Proiectul este o realizare remarcabilă, dar este adesea neglijată Voga actuală pentru produsele software open source (asociate în mod obișnuit cu Linux) își datorează originile intelectuale conceptului proiectului de software open source („deschis” în sensul de „liberă exprimare”, nu în sensul de „bere liberă” Mai mult În plus, sistemul de operare Linux își datorează o mare parte din popularitate instrumentelor GNU, care vă permit să configurați un mediu pentru nucleul Linux Cum funcționează sistemul de compilare Pentru programe simple precum hello c, ne putem baza pe sistemul de compilare pentru a construi un cod de mașină corect și eficient Cu toate acestea, există motive importante pentru care programatorii trebuie să înțeleagă cum funcționează sistemul de compilare □ Performanța programului de optimizare Compilatoarele moderne sunt instrumente care produc de obicei coduri de program eficiente Ca programatori, nu trebuie să știm ce este un compilator intern și cum funcționează pentru a obține coduri eficiente Dar, pentru a lua decizii bune de codificare, trebuie să înțelegem clar limbajul de asamblare în programele noastre C și modul în care compilatorul traduce diverse instrucțiuni ale limbajului C în limbaj de asamblare De exemplu, este o instrucțiune select mai eficientă decât o secvență de instrucțiuni if-then-else? Cât de scump este un apel de funcție? Este instrucțiunea while loop mai eficientă decât instrucțiunea do loop? Sunt referințele pointerului mai eficiente decât indecșii elementelor matrice? De ce este bucla noastră atât de rapidă dacă acumulăm suma într-o variabilă locală în loc de un argument care este transmis prin referință? Capitolul În capitolul , ne vom uita la limbajul de mașină Intel A și vom descrie modul în care compilatoarele traduc diferitele constructe ale limbajului C în acest limbaj În Capitolul , veți învăța cum să vă personalizați programele făcând modificări simple la codul dvs care să permită compilatorului să-și facă treaba Și în Capitolul , veți afla despre structura ierarhică a sistemului de memorie, cum compilatoarele de limbaj stochează matrice de date în memorie și cum programele dvs C pot folosi aceste informații pentru a funcționa mai eficient □ Înțelegerea erorilor care apar în timpul editării linkurilor Experiența noastră arată că unele dintre cele mai confuze erori de programare se referă la funcționalitatea linkerului, mai ales atunci când încercați să construiți sisteme software mari De exemplu, ce înseamnă când editorul de link-uri spune că nu poate rezolva link-urile? Ce se întâmplă dacă declarați două variabile globale în fișiere C diferite cu același nume? Care este diferența dintre biblioteca statică și biblioteca dinamică? De ce contează în ce ordine listăm bibliotecile pe linia de comandă? Și cel mai rău dintre toate, de ce erorile generate de linker nu apar înainte ca programul să înceapă să se execute? La toate aceste întrebări se va răspunde în capitolul □ Cum să evitați lacunele de securitate De ani de zile, eroarea de depășire a memoriei tampon a fost cauza unei mari probleme de securitate a rețelei și de server Astfel de erori există datorită faptului că mulți programatori nu au idee despre regulile de utilizare a stivelor pe care le urmează compilatorii atunci când generează coduri de funcție Vom descrie disciplina de utilizare a stivei și erorile de depășire a bufferului în Capitolul , ca parte a studiului nostru despre limbajul de asamblare Procesoarele citesc și interpretează instrucțiunile stocate în memorie În acest moment, programul nostru original hello c a trecut prin sistemul de compilare, care l-a convertit într-un fișier obiect executabil numit hello, care este acum stocat pe disc Pentru a executa un executabil pe un sistem Unix, îi trecem numele de la tastatură unei aplicații cunoscute sub numele de shell: unix> /bună ziua Salut Lume unix> Acest shell este un interpret de linie de comandă care afișează un prompt de comandă, așteaptă să tastați o linie de comandă și apoi execută comanda dată Dacă primul cuvânt al liniei de comandă nu este numele niciunei comenzi încorporate shell, atunci shell-ul deduce că acest cuvânt este numele unui fișier executabil pe care ar trebui să îl încarce și să îl execute Prin urmare, în cazul în cauză, coaja douăzeci Parte introductivă Privire de ansamblu asupra sistemelor informatice încarcă și execută programul hello, după care așteaptă finalizarea execuției acestuia Programul își imprimă mesajul pe ecran și apoi iese Apoi, shell-ul imprimă un prompt pentru următoarea comandă și așteaptă ca noua comandă să fie introdusă pe linia de comandă Organizarea hardware-ului sistemului Pentru a ști ce se întâmplă cu programul nostru Hello în timp ce rulează, trebuie să avem o idee despre cum este hardware-ul unui sistem computerizat tipic, a cărui diagramă bloc este prezentată în Fig Această diagramă bloc particulară este construită pentru familia Intel Pentium, cu toate acestea, toate sistemele de calcul au un aspect similar cu ele Nu vă faceți griji cu privire la complexitatea acestei diagrame de flux chiar acum – vom trece peste diferitele sale detalii pe parcursul cărții Orez Organizarea hardware-ului unui sistem de calcul tipic Cauciucuri Sistemul de calcul este pătruns de un set de conductori electrici, așa-numitele magistrale, prin care circulă octeți de informații între componentele sistemului Autobuzele sunt de obicei proiectate în așa fel încât să poată fi transmise bucăți care conțin un număr fix de octeți, numite cuvânt Numărul de octeți dintr-un cuvânt (dimensiunea cuvântului) este unul dintre sistemele fundamentale Capitolul , Excursii la sistemele informatice parametri întunecați care variază de la sistem la sistem De exemplu, unele sisteme au o dimensiune de cuvânt de de octeți, în timp ce sistemele de tip server, cum ar fi Intel Itaniums și familia de sisteme Sun SPARCS de ultimă generație, au o dimensiune de cuvânt de octeți În sistemele mai mici, cum ar fi cele utilizate ca vehicule sau comenzi industriale, dimensiunea cuvântului poate fi de unul sau doi octeți Pentru simplitate, presupunem că dimensiunea cuvântului este de de octeți, vom presupune că magistralele transmit în același timp un singur cuvânt Dispozitive I/O Dispozitivele I/O sunt mijloace de comunicare cu lumea exterioară În acest exemplu, sistemul are patru tipuri de dispozitive I/O: o tastatură și un mouse pentru intrarea utilizatorului, un dispozitiv de afișare a ieșirii utilizatorului și o unitate de disc (sau doar un disc) pentru stocarea pe termen lung a datelor și a programelor Inițial, fișierul executabil este stocat pe disc Fiecare dispozitiv I/O este conectat la magistrala I/O printr-un controler sau adaptor Diferența dintre ele constă în caracteristicile lor de design Controlerele sunt seturi de plăci instalate în dispozitivul propriu-zis sau pe placa principală de circuit imprimat (este adesea numită și placa de bază) Adaptorul este o placă care se conectează printr-o priză cu pin din placa de bază Indiferent de designul unor astfel de dispozitive, scopul lor este de a transmite informații între magistrala I/O și dispozitivul I/O în ambele direcții Capitolul descrie mai detaliat funcționarea dispozitivelor I/O, cum ar fi discul În Capitolul , veți învăța cum să utilizați interfața Unix I/O pentru a accesa dispozitivele din aplicația dvs Ne vom concentra pe o clasă deosebit de interesantă de dispozitive numite rețele: tehnologii speciale care își generalizează metodele de utilizare și la alte tipuri de dispozitive RAM RAM este un dispozitiv de stocare temporară care stochează temporar atât programul, cât și datele pe care le manipulează în timpul execuției Din punct de vedere fizic, memoria principală constă dintr-o colecție de cipuri dinamice de memorie cu acces aleatoriu În mod logic, memoria principală este organizată ca o secvență liniară de octeți, fiecare având propria sa adresă unică (index element de matrice); numărarea adreselor începe de la zero În general, toate instrucțiunile de mașină care alcătuiesc un program constau dintr-un număr variabil de octeți Mărimea elementelor de date corespunzătoare variabilelor programului C variază în funcție de tip De exemplu, pe o mașină Intel care rulează Linux, tipul de date scurt necesită doi octeți, tipurile de date int, float și long necesită patru octeți, iar tipul de date dublu opt octeți Parte introductivă Privire de ansamblu asupra sistemelor informatice Capitolul oferă o descriere mai detaliată a modului în care funcționează tehnologiile de memorie și cum este construită memoria principală din acestea Procesor Unitatea centrală de procesare (CPU, CPU), sau pur și simplu procesor, este mecanismul care interpretează (sau execută) instrucțiunile stocate în memoria principală Nucleul său este un dispozitiv de memorie cu un singur cuvânt (sau registru) numit contor de programe (PC) În orice moment, indică adresa unor instrucțiuni în limbajul mașinii din memoria principală Din momentul în care sistemul este pornit și până în momentul în care este oprit, procesorul realizează orbește și în mod repetat aceeași sarcină de bază fără întrerupere pentru o clipă Citește din memorie instrucțiunea specificată de contorul de program, interpretează biții instrucțiunii, efectuează operațiunile simple specificate de instrucțiune și apoi actualizează contorul pentru a indica adresa următoarei instrucțiuni, care poate fi sau nu adiacentă în memorie, la cea tocmai executata instructiuni Există doar câteva astfel de operații, ele circulă între memoria principală, fișierul de registru și unitatea logică aritmetică (ALU, ALU) Un fișier de registru este un mic dispozitiv de stocare care constă dintr-o colecție de registre de dimensiunea unui cuvânt, fiecare având propriul nume unic Dispozitivul calculează noi date și valori ale adresei Iată doar câteva exemple de operații simple pe care procesorul le poate efectua la solicitarea unei anumite instrucțiuni: □ Încărcare Copiați un octet sau un cuvânt din memoria principală într-un registru, suprascriind conținutul anterior al acelui registru □ Memorare Copiați un octet sau un cuvânt dintr-un registru într-o locație din memoria principală, suprascriind conținutul anterior al acelei locații □ Actualizarea datelor Copiați conținutul a două registre ALU care adaugă cele două cuvinte și stochează rezultatul într-unul dintre registre, suprascriind conținutul anterior al acelui registru □ Citiți I/O Copiați un octet sau un cuvânt de pe un dispozitiv I/O într-un registru □ Înregistrare I/O Copiați un octet sau un cuvânt dintr-un registru pe un dispozitiv I/O □ Tranziție Extrageți cuvântul din instrucțiunea în sine și copiați acest cuvânt în contorul programului, suprascriind conținutul anterior În capitolul , veți afla multe mai multe despre cum funcționează un procesor PC este, de asemenea, un acronim folosit în mod obișnuit pentru „personal computer” Diferența dintre concepte ar trebui să fie clară din context Capitolul Se execută programul salut Cu această reprezentare simplă a organizării hardware-ului și a operațiunilor descrise mai sus, începem să înțelegem ce se întâmplă atunci când executăm programul nostru exemplu Aici trebuie să omitem o mulțime de detalii, de care vom ține cont mai târziu, dar deocamdată vom fi destul de mulțumiți de imaginea de ansamblu Mai întâi, shell-ul programului își execută instrucțiunile, așteptând să introducem o comandă de la tastatură De îndată ce introducem caracterele „ /hello”, shell-ul citește fiecare dintre ele în registrul corespunzător și apoi le stochează în memoria principală, așa cum se arată în Fig Apoi apăsăm o tastă, shell-ul percepe acest lucru ca un semnal că comanda s-a încheiat Executabilul hello este încărcat prin executarea unei secvențe de instrucțiuni care copiază codul și datele conținute în fișierul obiect hello de pe disc în memoria principală Datele includ șirul de caractere „hello, world\n” care va fi tipărit în cele din urmă pe ecran Procesor Buna ziua Orez Citirea comenzii salut de la tastatură Folosind o tehnică cunoscută sub numele de acces direct la memorie (DMA, vezi capitolul b), datele sunt mutate de pe disc direct în memoria principală, fără a trece prin procesor Aceste acțiuni sunt prezentate în Fig Parte introductivă Privire de ansamblu asupra sistemelor informatice Procesor Orez Încărcarea fișierelor executabile în memoria principală Procesor fişier de înregistrare Eu RS I ALU Bus de sistem Bus de memorie Intrare- ieșire Memorie Bus de intrare alte dispozitive Autobuz de interfață Buna ziua UTILIZAți controlerul Graphic I adaptor | Controlor Tastatură mouse Afişa „Bună ziua, Warid\ri salut Executable salvat pe disc Orez Scrieți șirul de ieșire din memoria principală pe ecranul de afișare Capitolul Odată ce codul programului și fișierul obiect sunt încărcate în memorie, procesorul începe să execute instrucțiunile în limbajul mașinii ale subrutinei principale a programului hello Aceste instrucțiuni copiază octeții șirului „hello, world\n” din memoria principală într-un fișier de registru și de acolo în dispozitivul de afișare, pe al cărui ecran sunt afișați Aceste acțiuni sunt prezentate în Fig Diferite tipuri de cache O lecție importantă pe care o învățăm din acest exemplu simplu este că sistemul petrece mult timp mutând informații dintr-un loc în altul Instrucțiunile mașinii dintr-un program sunt inițial stocate pe disc Când un program este încărcat, acestea sunt copiate în memoria principală Pe măsură ce programul este executat de procesor, instrucțiunile sunt copiate din memoria principală pe procesor În mod similar, șirul de date „hello, world\n” care a fost stocat inițial pe disc este copiat în memoria principală și apoi copiat din memoria principală pe dispozitivul de afișare reduce „performanța reală” a programului Prin urmare, obiectivul principal a designerilor de sistem este să se asigure că operațiunile de copiere a datelor au loc cât mai repede posibil Datorită legilor pur fizice, cu cât dispozitivul de stocare este mai mare, cu atât funcționează mai lent Și, în același timp, crearea de dispozitive de stocare de mare viteză este mai costisitoare decât dispozitivele mai lente De exemplu, capacitatea unui disc poate fi de de ori mai mare decât memoria cu acces aleatoriu (memorie), dar va dura de milioane de ori mai mult pentru a citi un cuvânt din memoria discului decât din memoria principală De asemenea, un fișier registru tipic conține doar câteva sute de octeți de informații, în timp ce memoria principală conține milioane de octeți Cu toate acestea, procesorul poate citi datele din registre de aproximativ de ori mai repede decât din memorie Mai mult, pe măsură ce tehnologia semiconductoarelor continuă să evolueze de-a lungul anilor, divergența dintre procesor și memorie continuă să se adâncească Este mult mai ușor și mai ieftin să accelerezi procesoarele decât să faci memoria principală să ruleze mai rapid Pentru a reduce decalajul dintre procesor și memoria principală, proiectanții de sistem folosesc dispozitive mici și rapide numite cache (sau pur și simplu cache) pentru a servi drept zone de rezervă temporare pentru stocarea informațiilor de care procesorul ar putea avea nevoie în viitorul foarte apropiat Pe fig este afișată memoria cache a unui sistem tipic Cache-ul L de pe placa procesorului conține zeci de mii de octeți și sunt accesați practic la fel de rapid ca un fișier de registru Chiar și mai mult cache L , care conține de la sute de mii la milioane de octeți, este conectat la procesor printr-o magistrală specială Procesul de calcul va dura de ori mai mult pentru a accesa L decât L , dar este totuși de - ori mai rapid decât accesarea memoriei principale L și L sunt construite folosind o tehnologie cunoscută sub numele de Static Random Access Memory (SRAM) Parte introductivă Privire de ansamblu asupra sistemelor informatice Una dintre cele mai importante lecții din această carte este că programatorii de aplicații care sunt conștienți de memoria cache o pot folosi pentru a îmbunătăți performanța programelor lor cu ordine de mărime Vom explora aceste dispozitive importante și vom învăța cum să le folosim în Capitolul Cache autobuz L kzsh (SRAM) Orez Diferite tipuri de cache Memorie (DRAM) Dispozitivele de memorie formează o ierarhie Ideea de a pune un dispozitiv de stocare (cache) mic, dar mai rapid, între procesor și un dispozitiv de stocare mai mare, dar mai lent (memoria principală), s-a dovedit a fi foarte fructuoasă De fapt, dispozitivele de memorie din fiecare sistem de calcul se formează Mare, lent, ieftin Dispozitiv de stocare mic, rapid și scump Registrele CPU conțin cuvinte cache Cache-ul L conține linii H L Cache-ul L conține linii din memorie Unități locale Unitățile locale conțin date server de la distanță Memoria conține blocuri de date de pe discuri locale Memorie (DRAM) Cache L (SRAM) Registrele Cache L (SRAM) Orez Exemplu de ierarhie a memoriei Sisteme distribuite de stocare la distanță, server web Capitolul o ierarhie a memoriei ca cea prezentată în Fig Pe măsură ce vă deplasați în jos în această ierarhie de sus în jos, dispozitivele devin mai lente, mai mari și costul stocării unui singur bit scade Fișierul de registru ocupă poziția de sus în ierarhie, care este denumită nivelul sau L Cache-ul ocupă nivelul (de unde denumirea L ) Cache-ul L este la nivelul Memoria principală este la nivelul și așa mai departe Ideea de bază a unei ierarhii de memorie este că un nivel de memorie servește ca cache pentru următorul nivel inferior Astfel, fișierul de registru este un cache pentru memoria L , care este memoria cache pentru memoria principală, care la rândul său este memoria cache pentru disc În unele sisteme de rețea cu sisteme de fișiere distribuite, un disc local servește ca cache pentru datele stocate pe discuri în alte sisteme Așa cum programatorii folosesc structura cache-ului LI și L pentru a îmbunătăți performanța programelor lor, poate fi utilizată structura întregii ierarhii de memorie Aceste probleme vor fi discutate mai detaliat în capitolul Sistemul de operare controlează funcționarea hardware-ului Să revenim la exemplul nostru cu programul hello Când shell-ul a încărcat și executat programul hello și când programul hello și-a afișat mesajul, niciunul dintre programe nu avea acces direct la tastatură, disc sau memoria principală Pentru a face acest lucru, au folosit serviciile oferite de sistemul de operare Ne putem gândi la sistemul de operare ca la un fel de strat software între programul de aplicație și hardware, așa cum se arată în Figura Toate încercările unui program de aplicație de a manipula hardware-ul trebuie să treacă prin sistemul de operare Aplicație Sistem de operare Procesor Memorie Intrare ieșire >P Orez Sistemul de calcul ca sistem pe mai multe niveluri Un sistem de operare trebuie să îndeplinească în primul rând două cerințe de bază: să protejeze hardware-ul de acțiunile catastrofale ale unui program în fugă și să ofere aplicațiilor mecanisme simple și uniforme pentru manipularea hardware-ului de nivel scăzut complex și adesea foarte eterogen Sistemul de operare atinge ambele aceste obiective prin abstracțiile fundamentale prezentate în Figura : proces, memorie virtuală și fișiere După cum se poate observa din fig , fișierele sunt abstracții pentru dispozitivele I/O, memoria virtuală este o abstracție atât pentru memoria principală, cât și pentru dispozitivele I/O pe disc, iar procesele sunt abstracții pentru procesor, memoria principală și dispozitivele I/O Parte introductivă Privire de ansamblu asupra sistemelor informatice Procesele Memoria virtuală A i Fișiere G I/O memorie procesor Orez Abstracții implementate de sistemul de operare Standardele Unix și Posix Anii au fost dominați de sisteme de operare mari și complexe, cum ar fi OS/ de la IBM și Multics de la Honeywell În timp ce OS/ a fost unul dintre cele mai de succes sisteme de operare ale perioadei, Multics a avut o existență mizerabilă timp de mulți ani și nu a reușit să obțină o acceptare pe scară largă Laboratoarele Beli a fost inițial unul dintre partenerii în dezvoltarea proiectului Multics, dar s-a retras din proiect în din cauza complexității proiectului și a lipsei rezultatelor pozitive Experiența negativă acumulată în timpul dezvoltării sistemului a determinat un grup de cercetători ai companiei - Ken Thompson (Ken Thompson), Dennis Ritchie (Dennis Ritchie), Doug Makiloy (Doug Mcllroy) și Joe Ossanna (Joe Ossanna) - să înceapă lucrul în pe un sistem de operare mai simplu pentru un computer DEC PDP scris exclusiv în limbaj mașină Multe dintre ideile noului sistem, cum ar fi sistemul de fișiere ierarhic și shell-ul ca proces la nivel de utilizator, au fost împrumutate din sistemul Multics, dar au fost implementate într-un pachet software mai simplu și mai compact În , Brian Kemighan a ales numele „Unix” pentru denumirea noului sistem, ca contrapondere la numele „Multics”, subliniind astfel încetineala și greutatea sistemului Multics Nucleul Unix a fost rescris în limbaj în , iar sistemul de operare în sine a fost introdus publicului larg în [ ] Deoarece Beli Labs a furnizat codurile sursă instituțiilor de învățământ superior în condiții foarte favorabile, sistemul de operare a câștigat o mulțime de susținători ai sistemului Unix printre studenții și profesorii diferitelor universități Lucrarea cea mai influentă a fost făcută la UC Berkeley la sfârșitul anilor și începutul anilor , când cercetătorii din Berkeley au adăugat memorie virtuală și protocoale la o serie de versiuni numite Unix xBSD (Berkeley Software Distribution) Simultan, Beli Labs a lansat propriile versiuni de Unix, care au devenit cunoscute sub numele de System V Unix Versiunile de la alți furnizori de software, cum ar fi sistemul Sun Microsystems Solaris, au fost construite din versiunile originale BSD și System V Într-o oarecare măsură, Multics poate fi tradus ca multifațetat, în același context Unix poate fi tradus ca unilateral — Prim, persan Capitolul Complicațiile au apărut la mijlocul anilor optzeci când furnizorii de sisteme de operare au încercat să-și urmeze propriile căi adăugând caracteristici noi și adesea incompatibile Pentru a opri aceste tendințe separatiste, Institutul pentru Ingineri Electrici și Electronici (IEEE) a condus efortul de standardizare a sistemului Unix Richard Stallman a numit mai târziu produsul acestui efort „Posix ” programarea în rețea Pe măsură ce sistemele devin mai compatibile cu standardele Posix, diferențele dintre diferitele versiuni ale sistemului Unix se estompează treptat Procesele Când un program precum hello rulează pe un sistem modern, sistemul de operare dă iluzia că numai acel program este executat de sistem Se pare că doar acest program gestionează procesorul, memoria principală și dispozitivele I/O Procesorul, parcă, execută toate instrucțiunile programului la rând, una după alta, fără întreruperi, iar doar codul programului și datele acestuia sunt singurele obiecte care rezidă în memoria sistemului Sursa unor astfel de iluzii este conceptul de proces, una dintre cele mai importante și de succes idei din teoria calculatoarelor și sistemelor Un proces este o abstractizare a unui program care rulează într-un sistem de operare Multe procese pot rula pe același sistem în același timp și, în același timp, se pare că fiecare proces are drepturi exclusive de utilizare a hardware-ului Prin execuție concurentă înțelegem că instrucțiunile unui proces sunt intercalate cu instrucțiunile altui proces Sistemul de operare realizează această intercalare printr-un mecanism cunoscut sub numele de comutare de context Sistemul de operare ține evidența informațiilor de care un proces are nevoie pentru a se executa corect Starea, cunoscută sub numele de context, conține informații precum valoarea curentă a contorului programului, fișierul de registru și conținutul memoriei principale Există un singur proces care rulează pe sistem la un moment dat Când sistemul de operare decide să transfere controlul de la procesul curent la un proces nou, efectuează o schimbare de context, amintindu-și contextul procesului curent și restabilind contextul noului proces, apoi transferând controlul noului proces Noul proces reia execuția exact de unde a rămas Orez Figura ilustrează această idee de bază cu scriptul nostru hello ca exemplu În exemplul nostru de script, există două procese: un proces shell și un proces salut Inițial, sistemul rulează un singur proces, și anume procesul shell, așteptând intrarea în linia de comandă Când îl apelăm pentru a executa programul hello, shell-ul execută programul nostru treizeci Parte introductivă Privire de ansamblu asupra sistemelor informatice cere prin apelarea unei funcții speciale, așa-numita apel de sistem, care transferă controlul către sistemul de operare Sistemul de operare salvează contextul shell, creează un nou proces hello și contextul acestuia și apoi transferă controlul noului proces hello După ce se încheie Hello, sistemul de operare restabilește contextul procesului shell și îi revine controlul, după care așteaptă ca următoarea comandă să fie introdusă pe linia de comandă Timp salut proces procesul de coajă Aplicație Cred Cod OS Context J comutator Aplicație Cred Comutator j cod de context Cod aplicație Orez Procese de schimbare a contextului Implementarea abstracției procesului necesită o interacțiune strânsă între hardware-ul de nivel scăzut și programele sistemului de operare În Capitolul , vom vedea cum se face acest lucru, precum și cum programele de aplicație își pot crea și gestiona propriile procese Una dintre complicațiile introduse de implementarea conceptului de proces este că intercalarea diferitelor procese distorsionează ideea de timp, ca urmare a căreia programatorii întâmpină dificultăți semnificative în obținerea de date precise și sistematice privind timpul de execuție a programelor lor Capitolul analizează diferitele moduri în care timpul este reprezentat în sistemele actuale și descrie tehnici pentru efectuarea de măsurători precise a timpului cursuri Adesea ne gândim la un proces ca la o secvență de acțiuni care are o singură logică de control, cu toate acestea, în sistemele moderne, procesul poate consta de fapt din multe elemente executive numite fire (sau fire), fiecare fir rulând în contextul procesului, împărtășește cu procesul aceleași coduri de program și date globale Rolul firelor de execuție ca modele de programare este în continuă creștere datorită cerințelor de paralelism (simultaneitate) impuse de serverele de rețea, deoarece este mai ușor să partajați date între mai multe fire decât procese multiple și, de asemenea, pentru că firele sunt de obicei mult mai eficiente decât procesele Conceptul de bază al paralelismului, inclusiv filetarea, este tratat în Capitolul Capitolul Memorie virtuala Memoria virtuală este o abstractizare care dă fiecărui proces iluzia că el singur folosește memoria principală Fiecare proces are aceeași reprezentare de memorie, care este cunoscută sub numele de spațiu de adrese virtuale Spațiul de adrese virtuale pentru procesele sistemului de operare Linux este prezentat în Fig (Alte sisteme asemănătoare Unix utilizează aceeași topologie ) Pe un sistem Linux, partea superioară a spațiului de adrese este rezervată pentru codul și datele sistemului de operare respectiv, care sunt partajate de toate procesele Cele trei sferturi inferioare ale spațiului de adrese conțin coduri de program și date generate de procesele utilizatorului Atenție la faptul că adresele din diagramă cresc de jos în sus Oxffffffff Ohsoooooooo Stivă personalizată Invizibil pentru utilizator x Zona de memorie pentru biblioteci Memoria dinamică (când faci malloc) Citiți și scrieți date Date numai pentru citire salut Fișier executabil x Nefolosit Orez Procesați spațiul de adrese virtuale Spațiul de adrese virtuale, din punctul de vedere al fiecărui proces, este format dintr-un număr de zone bine definite, fiecare dintre ele își îndeplinește propria sarcină Aceste zone vor fi descrise în detaliu mai târziu în această carte, dar va fi util să ne uităm la fiecare dintre ele acum, începând cu adresele de jos și trecând în sus în direcția creșterii adreselor □ Codurile și datele programului Codul programului începe la aceeași adresă, urmat de locațiile de memorie corespunzătoare variabilelor globale ale limbii Zonele de coduri de program și date sunt inițializate direct de conținutul fișierului obiect executabil, în cazul nostru este fișierul executabil hello Această parte a spațiului de adrese va fi descrisă mai detaliat în Capitolul , în care vom studia editarea și încărcarea linkurilor Parte introductivă Privire de ansamblu asupra sistemelor informatice □ Memoria dinamică Codurile și datele programului sunt imediat urmate de zona de memorie dinamică a programului Spre deosebire de zonele de cod de program și date care sunt fixate odată ce procesul începe să ruleze, memoria dinamică se poate extinde și micșora în dimensiune în timpul execuției programului, ca urmare a apelurilor la biblioteca standard de programe precum taios și free Vom continua studiul nostru detaliat al memoriei dinamice după ce vom analiza gestionarea memoriei virtuale în Capitolul Despre bibliotecile partajate Aproximativ jumătate din spațiul de adrese este o zonă care stochează coduri de program și date pentru biblioteci partajate, cum ar fi o bibliotecă de programe C standard sau o bibliotecă de programe de matematică Conceptul de bibliotecă partajată este un concept puternic, dar oarecum dificil Veți învăța cum să lucrați cu ei când vom începe să învățăm despre legarea dinamică în Capitolul Oh, Stiva În partea de sus a spațiului de adrese virtuale se află stiva de utilizatori, care este utilizată de compilator pentru a implementa apelurile de funcții La fel ca memoria dinamică, stiva de utilizator se poate extinde și contracta dinamic în timpul execuției programului În special, de fiecare dată când apelăm o funcție, dimensiunea stivei crește De fiecare dată când ne întoarcem de la funcție, aceasta se scurtează În capitolul , veți afla cum folosește compilatorul stiva Despre memoria virtuală a nucleului Nucleul este partea sistemului de operare care se află în memoria principală Sfertul superior al spațiului de adrese este rezervat nucleului Programelor de aplicație le este interzis să citească și să scrie în această zonă sau să apeleze direct funcții scrise în codurile kernelului Pentru ca memoria virtuală să funcționeze, este necesară o interacțiune complexă între hardware și programele sistemului de operare, inclusiv traducerea hardware a fiecărei adrese generate de procesor Această idee de bază este de a stoca conținutul memoriei virtuale a procesorului pe disc și apoi de a folosi memoria principală ca memorie cache pentru disc Capitolul arată cum funcționează acest mecanism și de ce este atât de important pentru funcționarea sistemelor moderne Fișiere Fișierul este o secvență, nici mai mult, nici mai puțin Fiecare dispozitiv I/O, inclusiv discuri, tastaturi, dispozitive de afișare și chiar rețele de computere, este modelat cu un fișier corespunzător Toate I/O de sistem sunt realizate prin citirea și scrierea fișierelor printr-o serie de apeluri de sistem cunoscute sub numele de I/O sistem Unix Aceasta este o noțiune simplă și elegantă de fișier, dar are o semnificație profundă, deoarece oferă o vedere unificată a întregii varietăți Capitolul fișiere care pot face parte din sistem De exemplu, programatorii de aplicații care manipulează conținutul unui fișier de disc nu sunt complet familiarizați cu tehnologia discului și sunt destul de confortabili în acest sens Mai mult, același program va rula pe sisteme diferite care folosesc tehnologii diferite de disc I/O Unix este discutat în Capitolul , Retragere Proiect Linux În august , un student absolvent finlandez pe nume Linus Torvalds a anunțat modest finalizarea nucleului pentru un nou sistem de operare asemănător Unix: De la: torvalds@klaava Helsinki FI (Linus Benedict Torvalds) Grupul de știri din rețea: comp os minix Subiect: Ce ți-ar plăcea cel mai mult să vezi în minix? Rezumat: sondaj limitat cu privire la noul meu sistem de operare Data: august : : GMT În atenția tuturor celor care folosesc sistemul minix: Dezvolt un sistem de operare (gratuit) (este doar un hobby, sistemul este mic și neprofesionist, spre deosebire de GNU) pentru computerele personale AT / Proiectul se maturizează din aprilie, acum capătă un aspect finit Aș dori să știu părerea oamenilor care lucrează cu minix (fie că aprobă sau dezaprobă sistemul meu), deoarece sistemul meu de operare seamănă într-o oarecare măsură cu minix (aceeași aspect fizic al sistemului de fișiere, din motive practice, împreună cu alte caracteristici comune) Momentan am portat programele bash( ) și gcc( ) și, în mod ciudat, funcționează Asta înseamnă că în câteva luni voi putea obține ceva util și aș dori să știu ce ar dori majoritatea să vadă în produsul meu software Sunt recunoscător pentru orice sugestie, în același timp nu promit că voi îndeplini totul Linus (torvalds@kruuna helsinki fi) Orice altceva, după cum se spune, este istorie Sistemul de operare Linux a devenit un fenomen tehnic și cultural Prin fuziunea cu proiectul GNU, proiectul Linux a furnizat o versiune completă, compatibilă cu Posix, a sistemului de operare Unix, inclusiv nucleul și toată infrastructura care îl susține Linux rulează cu succes pe o gamă largă de computere, de la PDA-uri la mainframe Un grup de dezvoltatori IBM a reușit să-l transfere pe un ceas de mână! Schimbul de date în rețele Până în acest moment al turului nostru, am considerat sistemele ca o colecție izolată de hardware și software În practică, sistemele moderne sunt adesea conectate la alte sisteme prin sisteme informatice Din punctul de vedere al unui singur sistem, rețeaua poate fi văzută doar ca un alt dispozitiv Parte introductivă Privire de ansamblu asupra sistemelor informatice Port I/O, așa cum se arată în fig Când sistemul copiază o secvență de octeți din memoria principală pe adaptorul de rețea, datele circulă prin rețea către o altă mașină în loc de, să zicem, unitatea de disc locală De asemenea, sistemul poate citi datele trimise de la alte mașini și poate copia acele date în memoria sa principală Procesor Orez Rețeaua este un alt dispozitiv I/O Odată cu apariția rețelelor extinse, cum ar fi Internetul, copierea informațiilor de pe o singură mașină a devenit una dintre cele mai importante utilizări ale rețelelor de calculatoare De exemplu, aplicațiile precum e-mailul, mesageria, FTP (File Transfer Protocol) și accesul la TV în rețea se bazează pe copierea informațiilor în rețea Revenind la exemplul nostru hello, putem folosi o aplicație familiară de acces la rețea pentru a executa programul hello pe o mașină la distanță Să presupunem că am folosit un client de acces la rețea care rulează pe mașina noastră pentru a ne conecta la un server de acces la rețea pe o mașină de la distanță După ce ne-am conectat la mașina de la distanță și am pornit un shell, shell-ul la distanță așteaptă să sosească o comandă de intrare Din acest moment, procesul de la distanță al programului hello necesită cinci pași de bază, prezentati în Figura După ce introducem șirul „hello” către clientul de acces la rețea și apăsăm tasta Enter, clientul redirecționează acest șir către serverul de acces la rețea După Capitolul odată ce serverul primește acest șir din rețea, îl va transmite shell-ului Shell-ul de la distanță va executa apoi programul hello și va returna șirul de ieșire la server În cele din urmă, serverul trimite șirul de ieșire către client prin intermediul rețelei, care îl afișează pe terminalul nostru local Tipuri de utilizatori Buna ziua Clientul trimite „bună ziua” serverului telnet Clientul afișează „hello, world\n” pe ecran Serverul Telnet trimite „bună ziua, lume\n” client coajă, care execută programul și trimite rezultatul către serverul telnet Serverul trimite „hello Orez Utilizarea accesului la rețea pentru a executa programul hello pe o mașină la distanță Acest tip de schimb între clienți și servere este comun tuturor aplicațiilor de rețea În capitolul , veți învăța cum să construiți aplicații de rețea și să aplicați ceea ce ați învățat pentru a construi servere web simple Pasii urmatori Aceasta încheie prima noastră excursie în sistemele informatice Un motiv important pentru a nu discuta mai departe este că un sistem este mai mult decât hardware Mai degrabă, este o rețea de hardware și software de sistem care trebuie să interacționeze pentru a atinge scopul final de a rula programe de aplicație Tot conținutul suplimentar al cărții este dedicat acestui subiect rezumat Un sistem de calcul este format din hardware și software care interacționează pentru a executa programe de aplicație Informațiile din interiorul unui computer sunt reprezentate ca grupuri de biți, care sunt interpretate în funcție de context Programele sunt traduse de alte programe în diverse forme, mai întâi sunt prezentate ca texte în coduri ASCII, apoi sunt convertite de către compilatoare și linkere în fișiere executabile Procesoarele citesc și interpretează instrucțiuni binare care sunt stocate în memoria principală Deoarece computerele își petrec cea mai mare parte a timpului copiend date din memorie, dispozitive I/O și registre centrale ale procesorului, dispozitivele de memorie ale sistemului sunt organizate într-o anumită ierarhie, în vârful căreia se află registrele centrale ale procesorului, urmate de mai multe niveluri de implementare hardware memoria cache, memoria principală DRAM și memoria discului Dispozitivele de memorie mai înalte în ierarhie sunt mai rapide și mai scumpe pe bit decât acelea Parte introductivă Privire de ansamblu asupra sistemelor informatice sunt în ierarhia de mai jos Dispozitivele de memorie care sunt situate mai sus în ierarhie servesc ca memorie cache pentru dispozitivele de memorie situate mai jos Programatorii au capacitatea de a optimiza performanța programelor lor C prin învățarea și profitând de caracteristicile ierarhiei memoriei Nucleul sistemului de operare servește ca intermediar între aplicație și hardware Implementează trei abstractizări fundamentale: □ Fișierele sunt abstracții cu privire la dispozitivele I/O □ Memoria virtuală este o abstractizare atât a memoriei principale, cât și a discurilor □ Procesele sunt abstracții despre procesoare, memoria principală și dispozitivele I/O În cele din urmă, rețelele oferă sistemelor informatice capacitatea de a comunica între ele Din punctul de vedere al unui anumit sistem, rețeaua nu este altceva decât un dispozitiv de intrare-ieșire Note bibliografice Ritchie a scris relatări interesante și de încredere despre primele zile ale C și ale sistemului Unix [ , ] Ritchie și Thompson au publicat primul lor raport despre sistem Silberschatz și Gavin [ ] au prezentat o descriere cuprinzătoare a diferitelor caracteristici ale sistemului Paginile web ale Proiectului GNU (www gnu org) și ale sistemului de operare Linux (www linux org) conțin informații actuale și istorice Din păcate, informațiile despre standardele Posix nu sunt disponibile online Acesta trebuie comandat la un cost suplimentar de la Institutul IEEE (standards ieee org) PARTEA I Structura și execuția programului Studiul sistemelor informatice începe cu studiul computerului însuși, format dintr-un procesor și un subsistem de memorie În esență, avem nevoie de modalități de a reprezenta tipurile de date de bază ca aproximări ale numerelor întregi și reale De aici, va fi posibil să luăm în considerare modul în care instrucțiunile la nivel de mașină procesează aceste date și cum compilatorul traduce programele C în instrucțiuni În continuare, vom studia procedurile individuale de accesare a procesorului pentru a înțelege mai bine utilizarea resurselor hardware la executarea instrucțiunilor Înțelegând cum funcționează compilatoarele la nivel de cod al mașinii, puteți îmbunătăți performanța programului prin scrierea unui cod sursă care să compileze eficient Se va avea în vedere modelarea memoriei computerului, una dintre cele mai complexe componente ale sistemelor informatice moderne Această parte a cărții va oferi cititorilor o înțelegere profundă a reprezentării mașinii și a execuției programelor de aplicație Abilitățile dobândite vor ajuta la scrierea de programe stabile, valorificând la maximum resursele computerului CAPITOLUL Prezentarea informațiilor și lucrul cu acestea □ Stocarea informațiilor □ Reprezentare întreagă □ Aritmetică întregi □ Numere în virgulă mobilă □ Reluați Calculatoarele moderne stochează și procesează informațiile prezentate sub formă de semnale binare Aceste caractere binare umile, sau biți, formează baza revoluției digitale Sistemul zecimal familiar a fost folosit de de ani; a fost inventat în India, în secolul al XII-lea matematicienii arabi l-au îmbunătățit, iar în Occident a apărut în secolul al XIII-lea „cu ajutorul” matematicianului italian Leonardo Pisano, mai cunoscut sub numele de Fibonacci Folosirea calculului zecimal este firească pentru oamenii care au zece degete, cu toate acestea, atunci când creează mașini pentru stocarea și procesarea informațiilor, valorile binare sunt mai acceptabile Semnalele binare sunt ușor de reprezentat, stocat și transmis, de exemplu, ca prezența sau absența unei găuri într-o bandă perforată, ca tensiune înaltă sau joasă într-un circuit electric, sau ca electromagnet orientat în sensul acelor de ceasornic sau în sens invers acelor de ceasornic Circuitele electronice pentru stocarea și calcularea semnalelor binare sunt foarte simple și fiabile, permițând producătorilor să combine milioane de astfel de circuite într-un singur cip de siliciu În sine, un singur bit are o valoare mică Cu toate acestea, prin combinarea biților în grupuri și aplicarea unei interpretări specifice care dă o anumită semnificație diverselor combinații de biți, este posibil să se reprezinte elementele oricărei mulțimi finite De exemplu, folosind sistemul de numere binar, grupurile de biți pot fi folosite pentru a codifica numere nenegative Puteți utiliza codul de caractere standard pentru a codifica literele și simbolurile din documentul dvs Acest capitol discută ambele tipuri de codificări, precum și codificări pentru reprezentarea numerelor negative și pentru aproximarea numerelor reale Partea I Structura și execuția programului Aici autorii iau în considerare trei codificări majore ale numerelor Codificările fără semn se bazează pe reprezentarea tradițională binară a numerelor mai mari sau egale cu zero Codificările complementului doi sunt cel mai comun mod de a reprezenta numere întregi cu semn, care pot fi fie pozitive, fie negative Codificările în virgulă mobilă sunt versiunea binară a notației științifice pentru reprezentarea numerelor reale Folosind diferite reprezentări, calculatoarele efectuează operații aritmetice, cum ar fi adunarea și înmulțirea, similare cu operațiile corespunzătoare cu numere întregi și numere reale Reprezentările computerizate folosesc un număr limitat de biți pentru a codifica un număr, astfel încât unele operațiuni pot provoca depășiri atunci când numerele sunt prea mari pentru a fi reprezentate Acest lucru poate duce la rezultate uimitoare De exemplu, pe majoritatea computerelor moderne, calculul expresiei * * * dă - Acesta este calculul conform regulilor aritmeticii fixe - calculul produsului numerelor pozitive a condus la un negativ rezultat Pe de altă parte, aritmetica fixă satisface multe dintre regulile binecunoscute ale aritmeticii întregi De exemplu, asociativitatea și comutativitatea înmulțirii: evaluarea oricăreia dintre următoarele expresii C are ca rezultat - : ( * ) * ( * ) (( * ) * ) * (( * ) * ) ♦ *( *( * )) Este posibil ca computerul să nu producă rezultatul așteptat, dar cel puțin este consecvent! Aritmetica în virgulă mobilă are proprietăți matematice complet diferite Produsul unui set de numere pozitive va fi întotdeauna pozitiv, deși overflow va produce o valoare specială: +* Pe de altă parte, aritmetica în virgulă mobilă nu este asociativă din cauza preciziei finite a reprezentării De exemplu, reprezentarea lui ( + e )- e pe majoritatea mașinilor ar fi , în timp ce +( e - e ) ar fi Examinând reprezentările numerice reale, se pot înțelege intervalele de valori care pot fi reprezentate, precum și proprietățile diferitelor operații aritmetice Înțelegerea acestui lucru este esențială pentru scrierea programelor care funcționează corect pe întreaga gamă de valori numerice și sunt portabile la diferite configurații de mașini, sisteme de operare și compilatoare Calculatoarele folosesc mai multe reprezentări binare diferite pentru a codifica valori numerice Pe măsură ce aprofundăm subiectul programării la nivel de mașină, care este tratat în Capitolul , cititorul va trebui să se familiarizeze cu aceste reprezentări Codificările sunt descrise în acest capitol și oferă cititorului câteva argumente practice pentru sistemele numerice Capitolul Prezentarea și lucrul cu informații Au fost dezvoltate mai multe metode pentru a efectua operații matematice direct la nivel de biți Înțelegerea acestor tehnici este esențială pentru înțelegerea codului la nivel de mașină generat la compilarea expresiilor aritmetice Autorii propun o interpretare matematică a materialului În primul rând, sunt date definițiile de bază ale codificărilor, după care sunt derivate proprietăți precum gama de numere reprezentabile, reprezentările lor la nivel binar și proprietățile operațiilor aritmetice Autorii consideră că este util să luăm în considerare acest material dintr-un punct de vedere atât de abstract, deoarece programatorii trebuie să aibă o înțelegere clară a modului în care aritmetica computerizată se raportează la aritmetica mai familiară a numerelor întregi și reale Acest lucru poate părea intimidant, dar interpretarea matematică necesită doar cunoașterea elementelor de bază ale algebrei Pentru a consolida legăturile dintre interpretarea formală și câteva exemple din viața reală, recomandăm rezolvarea unor exerciții practice Cum să citești acest capitol Dacă vreuna dintre ecuații și formule descurajează cititorul, nu renunțați să încercați să profitați la maximum de acest capitol! Pentru a fi complet, aici sunt oferite rezumate complete ale ideilor matematice, dar cel mai bun mod de a începe cu materialul este să le omiteți În schimb, încercați câteva exemple simple (exerciții) pentru a vă dezvolta intuiția, apoi verificați cum derivarea matematică întărește intuiția Limbajul de programare C++ este construit pe deasupra C și folosește exact aceleași reprezentări și operații de date Tot ce s-a spus în acest capitol despre C se aplică la fel de mult și pentru C++ Definiția limbajului Java a creat un nou set de standarde pentru reprezentarea datelor și a operațiilor În timp ce standardul C este conceput pentru a fi utilizat pe scară largă, standardul Java este destul de specific în formatele de date și codificări Acest capitol evidențiază vizualizările și operațiunile suportate de Java în mai multe locuri Stocare a datelor În loc să acceseze biți individuali din memorie, majoritatea computerelor folosesc blocuri de biți, sau octeți, ca cele mai mici unități de memorie Un program la nivel de mașină tratează memoria ca pe o serie foarte mare de octeți, numită memorie virtuală Fiecare octet de memorie are un număr unic numit adresă, iar setul tuturor adreselor posibile se numește spațiu de adrese virtuale După cum sugerează și numele, spațiul virtual de adrese este doar o imagine conceptuală a unui program la nivel de mașină Implementarea actuală, descrisă în Capitolul , folosește o combinație de memorie cu acces aleatoriu (RAM), stocare pe disc, hardware special și software de sistem de operare pentru a oferi unui program ceea ce se numește o matrice de octeți contigui Partea I Structura și execuția programului Una dintre sarcinile compilatorului și ale sistemului de suport al programului este de a împărți spațiul de memorie în segmente gestionabile pentru stocarea diferitelor obiecte de program, adică date de program, instrucțiuni și informații de control Diferite mecanisme sunt utilizate pentru a aloca și gestiona memorie pentru diferite părți ale unui program Toată această gestionare se realizează în spațiul de adrese virtuale De exemplu, valoarea unui pointer în C, indiferent dacă indică către un întreg, o structură sau un alt element de program, este adresa virtuală a primului octet al unui bloc de memorie Compilatorul C asociază, de asemenea, informații de tip cu fiecare pointer, astfel încât poate genera diferite coduri la nivel de mașină pentru accesarea valorii stocate în locația desemnată de pointer, în funcție de tipul acelei valori Deși compilatorul C menține informații de tip, programul real la nivel de mașină pe care îl generează nu conține informații despre tipurile de date Fiecare obiect de program apare pur și simplu ca un bloc de octeți, iar programul în sine ca o secvență de octeți Rolul pointerilor în C Pointerii sunt o caracteristică de bază a lui C Ele oferă un mecanism pentru referirea membrilor structurilor de date, inclusiv matrice La fel ca o variabilă, un pointer are doi parametri: o valoare și un tip Valoarea indică locația (celula) unui anumit obiect, iar tipul indică ce fel de obiect (de exemplu, un număr întreg sau cu virgulă mobilă) este stocat în această celulă Sistem hexazecimal Un octet este format din opt biți În sistemul binar, intervalul valorilor sale este de la la Pentru un întreg zecimal, intervalul este de la la Reprezentarea binară este prea greoaie, iar pentru zecimală este foarte obositor de efectuat conversii în combinații de biți și invers În schimb, modelele de biți sunt scrise ca numere hexazecimale Sistemul hexazecimal folosește numere de la la și litere de la A la F În tabel arată valorile zecimale și binare ale caracterelor hexazecimale Când este scrisă în hexazecimal, valoarea fiecărui octet este în intervalul până la FF Tabelul Sistem hexazecimal Număr hexazecimal Valoare zecimală Valoare binară UN DOD Număr hexazecimal A C D E F Valoare zecimală și Valoare binară Capitolul Prezentarea informațiilor și lucrul cu acestea Constantele numerice care încep cu x sau x sunt interpretate ca hexazecimale Literele de la A la F pot fi folosite atât cu litere mari, cât și cu litere mici De exemplu, puteți scrie numărul FA D B ca xFAlD B, ca xfald b sau chiar amestecând litere mari și mici, cum ar fi xFalD b În această carte, notația C va fi folosită pentru a reprezenta valori hexazecimale O sarcină comună atunci când lucrați cu programe la nivel de mașină este de a converti manual între reprezentări zecimale, binare și hexazecimale ale modelelor de biți Conversia dintre reprezentările binare și hexazecimale este simplă, deoarece se poate face doar o cifră hexazecimală odată O modalitate ușoară de a face conversii mentale este să memorezi echivalentele zecimale ale numerelor hexazecimale a, c și f Valorile hexazecimale în, D și E pot fi convertite în valori zecimale prin evaluarea valorilor lor în raport cu primele trei De exemplu, să presupunem că vi se dă numărul x A C Poate fi convertit în binar prin extinderea fiecărui număr hexazecimal astfel: hex A s binar UN Aceasta dă valoarea binară În schimb, având în vedere numărul binar , îl puteți converti în hexazecimal împărțindu-l mai întâi în grupuri de patru biți fiecare Cu toate acestea, rețineți că, dacă numărul total de biți nu este un multiplu de patru, atunci grupul din stânga ar trebui să fie mai mic de patru biți, completând efectiv numărul cu zerouri de început Apoi, fiecare grup de patru biți este tradus în numărul hexazecimal corespunzător: binar hexazecimal c a d c c EXERCIȚIUL Efectuați următoarele conversii de numere: x F A - În binar Binar de la la hexazecimal XC E D - la binar Binar la hexazecimal Când x este o putere a lui doi, adică x = n pentru unele n, atunci x poate fi scris cu ușurință în hexazecimal, amintindu-ne că reprezentarea binară a lui x este pur și simplu urmată de n zerouri Numărul hexazecimal o reprezintă co Partea I Structura și execuția programului lupta cu patru zerouri binare de început Prin urmare, pentru u scris sub forma / + /, unde O /d h da rezultatul: = x = x f = x ef În mod similar, următorul script convertește numerele hexazecimale în numere zecimale din Lista Partea I Structura și execuția programului Lista Convertirea în binar #!/usr/local/bin/perl # Convertiți lista de numere hexazecimale în zecimale pentru ($i = ; $i typedef unsigned char *byte pointer; void show bytes (byte pointer start, int len) { int i; pentru (i = ; i O Deși operațiile cu resturile produc rezultate diferite față de aritmetica întregului, ea împărtășește multe din aceleași proprietăți Alte inele notabile includ numerele raționale și reale Dacă înlocuim operația „SAU” a algebrei booleene cu operația „SAU exclusiv” și operația de complement cu operația de identitate /, unde I(a) = a pentru tot a, atunci rezultatul va fi structura ({ , }, n, &, /, , ) Această structură nu mai este o algebră booleană; de fapt, este un inel Poate fi considerată ca o formă foarte simplificată a unui inel format din toate numerele întregi { , , , u- } cu adunarea și înmulțirea efectuate modulo n În acest caz, avem n = Adică , operațiile booleene „ȘI” și „XOR” corespund înmulțirii și, respectiv, adunării modulo Una dintre proprietățile curioase ale acestei algebre este că fiecare element este reprezentat de propria sa inversiune aditivă: a A I(a) = a A a = Cine, în afară de matematicieni, sunt interesați de inelele booleene Ori de câte ori cineva ascultă exclusiv muzică pură înregistrată pe un CD sau vizionează un film pe un DVD, se profită de inelele booleene Aceste tehnologii se bazează pe coduri de corectare a erorilor concepute pentru a citi corect biții chiar și de pe un disc murdar sau zgâriat Baza matematică a acestor coduri de corectare a erorilor este algebra liniară bazată pe inele booleene Aceste patru operații booleene pot fi extinse pentru a lucra pe vectori de biți, șiruri de zerouri și unii cu o anumită lungime ѵv Operațiile sunt definite pe bitvectori în funcție de aplicarea lor la elementele de potrivire ale argumentelor De exemplu, să presupunem că [aw b aw , " Înainte] & [bw bw , " £>o] este [au, i & aw & bw , » yao & Ao], și în mod similar pentru ~, | și eu Presupunând că { , } Г va desemna mulțimea tuturor șirurilor de zerouri și unități de lungime ѵv, Capitolul Prezentarea informațiilor și lucrul cu acestea iar a"' este un șir format din w repetări ale caracterului a, veți vedea că algebra rezultată: ({ , !}'*', |, &, ~, O”', G> și ({O , }u, A, &, /, d', Im) formează algebre booleene și, respectiv, inele Fiecare cantitate w definește o algebră booleană separată și un inel boolean separat Sunt inelele booleene și aritmetica claselor reziduale același lucru? Inelul boolean cu două elemente ({ , }, A, &, /, , ) este identic cu inelul de numere întregi modulo doi (Z , + , x , ~ , , ) Cu toate acestea, unirea vectorilor de biți de lungime w dă un inel care este complet diferit de aritmetica claselor reziduale EXERCIȚIUL Completați următorul tabel cu rezultatele evaluării operațiilor booleene pe vectori de biți Rezultatul operațiunii a b [ ] [ ] ~b a &b a\b aL b O utilizare utilă a vectorilor de biți este reprezentarea mulțimilor finite De exemplu, orice submulțime Rc { , , , w - ) poate fi reprezentată ca un vector de biți [a^ b , ab a ], unde a, = dacă și numai dacă / e A De exemplu (reținând că alf j este scris în stânga și a în dreapta), avem a = [ ], reprezentând mulțimea A = { , , , } și b = [ ], reprezentând mulţimea B = { , , , } Cu această interpretare, operațiile booleene | și & corespund uniunii și conjuncției mulțimii, ~ corespunde complementului mulțimii De exemplu, operația a & b produce vectorul de biți [ ], în timp ce A P B = { , } De fapt, pentru orice mulțime S, structura (P( ), U, A, , ) formează o algebră booleană, unde P( ) denotă mulțimea tuturor submulțimii lui S, denotă mulțimea operatorului complement Adică, pentru orice mulțime A, complementul său este mulțimea Â = {ae a &A} Abilitatea de a reprezenta și de a manipula mulțimi finite folosind operații cu vector de biți este o deducție practică din principiul matematic Partea I Structura și execuția programului ?l« Calculatoarele creează imagini color pe un monitor sau pe un ecran cu cristale lichide amestecând trei culori diferite ale spectrului de lumină: roșu, verde și albastru Imaginați-vă o diagramă simplă cu trei culori diferite, fiecare dintre acestea putând fi proiectată pe un ecran de sticlă: Surse de lumină Ecran Orez Proiecții pe ecran Observator Acum puteți crea opt culori diferite în funcție de absența ( ) sau prezența ( ) de lumini: Roșu Verde Albastru Culoare Negru Albastru Verde Albastru Roșu Stacojiu Galben Alb Acest set de culori formează o algebră booleană cu opt elemente Complementul de culoare se formează prin stingerea luminii aprinse și stingerea acesteia Care vor fi complementele celor opt culori enumerate? Ce culori corespund valorilor booleene și I pentru această algebră? Capitolul Prezentarea și lucrul cu informații Descrieți efectul operațiilor booleene asupra următoarelor culori: Albastru | Roșu = Stacojiu și albastru = Verde L Alb = Operații la nivel de biți în C Una dintre caracteristicile utile ale C este că acceptă operații booleene pe biți De fapt, simbolurile folosite pentru operațiile booleene se aplică în C: □ I — SAU; □ & —și; □ - NU; □ L - SAU exclusiv Acest lucru se aplică oricărui tip de date întregi, adică unuia declarat ca char sau int cu sau fără specificatori, cum ar fi short, long sau unsigned Iată câteva exemple de evaluări de expresie (Tabelul ): Tabelul Expresii la nivel de biți Expresia C Expresie binară Rezultat binar Rezultat C - x ~ [ ] [ ] OxBE - x ~ [ ] [ ] OxFF x și x [ ] și [ ] [ ] x x | x [oiioiooi]| [oioioioi] [ ] x D După cum arată exemplele noastre, cea mai bună modalitate de a determina efectul unei expresii la nivel de biți este de a extinde argumentele hexazecimale la reprezentările lor binare, de a efectua operația în binar și de a converti în hexazecimal EXERCIȚIUL Pentru a demonstra proprietățile unui inel, luați în considerare Lista R'G'TG": — - " " : ѵ ; ? h - i Lista Procedura de înlocuire void inplace swap (int *x, int *y) { *x = *x ~ y;/ Pasul */ Partea I Structura și execuția programului * Y \u d * x l y; / Pasul * / * x \u d * x y; / Pasul * / } Deja prin nume se poate argumenta că acțiunea acestei proceduri este o permutare a valorilor stocate în celulele desemnate de variabilele pointer x și y Rețineți că, spre deosebire de tehnica obișnuită de a schimba două valori, nu este nevoie de o a treia celulă pentru a stoca temporar o valoare în timp ce o mutați pe cealaltă În ceea ce privește performanța, nu există o astfel de modalitate de a permuta profitul; câștigul are loc numai sub formă de divertisment intelectual Începând cu valorile lui a și b în celulele indicate de x și respectiv y, completați următorul tabel cu valorile stocate în cele două celule după fiecare pas al procedurii Pentru a demonstra efectul, utilizați proprietățile inelului Amintiți-vă că fiecare element este propriul său invers aditiv (a = ) Pas *x *y Inițial un b Pasul Pasul Pasul O utilizare comună a operațiilor la nivel de biți este implementarea operațiilor de mascare, unde o mască este o combinație de biți care indică un set selectat de biți dintr-un cuvânt De exemplu, masca Oxff (cei opt biți mai puțin semnificativi sunt cei) indică octetul de nivel scăzut dintr-un cuvânt Operația la nivel de biți x & Oxff produce o valoare constând din octetul x cel mai puțin semnificativ, dar toți ceilalți octeți sunt zero De exemplu, dacă x = x abcdef, expresia va avea ca rezultat xOOOOOOef Expresia ~ va avea ca rezultat o mască de toate , indiferent de lungimea cuvântului Deși aceeași mască poate fi scrisă ca xFFFFFFFF pentru o mașină pe de biți, un astfel de cod nu este portabil EXERCIȚIUL Octet x cel mai puțin semnificativ cu toți ceilalți biți setați la [OxFFFFFFBA] Complement al octetului cel mai puțin semnificativ x; toți ceilalți octeți rămân neschimbați [ X FDEC ] Toți octeții x, cu excepția celui mai puțin semnificativ; octetul cel mai puțin semnificativ este setat la [ X FDEC ] Deși aceste exemple presupun o lungime a cuvântului de de biți, codul rezultat ar trebui să funcționeze pentru orice lungime a cuvântului w > Capitolul Prezentarea și lucrul cu informații EXERCIȚIUL De la sfârșitul anilor până la sfârșitul anilor ai secolului trecut, computerul Digital Equipment VAX a fost foarte popular În loc de instrucțiuni pentru operațiile booleene „ȘI” și „SAU”, avea instrucțiunile bis (set de biți) și bіc (bit liber) Ambele instrucțiuni preiau cuvântul informativ x și cuvântul masca m Ele produc un rezultat z , constând din biții lui x modificați în funcție de biții m Când se utilizează bis, modificarea include setarea z la la fiecare poziție de bit unde m este Când se utilizează bic, modificarea include setarea z la la fiecare poziție de bit unde m este Pentru a calcula impactul acestor două comenzi, este necesar să scrieți funcțiile bis și bіc Completați următorul cod folosind operații C la nivel de biți: /* Set de biți */ int bis (int x, int m) ( /* Scrieți o expresie în C pentru a calcula impactul mai multor biți */ int re suit = ; returnează rezultatul; } /* Bit Clear */ int bic (int x, int m) ( /* Scrieți o expresie C pentru a calcula impactul biților liberi */ int rezultat = ; returnează rezultatul; } Operații booleene în C Limbajul C oferă, de asemenea, un set de operatori logici | |, && și ! corespunzătoare operațiilor „SAU”, „ȘI” și „NU” ale logicii propoziționale Este ușor să le confundați cu operațiuni la nivel de biți, dar îndeplinesc funcții complet diferite Operațiile booleene tratează orice argument diferit de zero ca fiind adevărat și O ca fals Ele returnează fie , fie , indicând fie adevărat, fie, respectiv, fals Iată câteva exemple de evaluare a expresiei: Expresie Rezultat ! x x ! x x !! x x x && x x x x x Partea I Structura și execuția programului Rețineți că operația pe bit se potrivește cu omologul său logic numai în cazul special în care argumentele sunt limitate la sau A doua diferență importantă între operatorii logici &&, și omologii lor la nivel de biți &, | este că operatorii logici nu își evaluează al doilea argument dacă rezultatul expresiei poate fi determinat prin evaluarea primului argument Prin urmare, de exemplu, expresia a && /a nu va provoca niciodată o împărțire la zero, iar expresia p && *p++ nu va determina niciodată dereferențiarea unui pointer nul EXERCIȚIUL Să presupunem că x și y au valori de octet de x și, respectiv, x Completați următorul tabel cu valorile octeților diferitelor expresii C: Valoarea expresiei Valoarea expresiei x & y x && y X y X Y ~X -y !x !y X & !y X && ~y EXERCIȚIUL Folosind numai operații la nivel de biți și boolee, scrieți o expresie C echivalentă cu x == y Cu alte cuvinte, rezultatul va fi când x și y sunt egali și în caz contrar Operații de schimbare în C C oferă, de asemenea, un set de operații pentru deplasarea combinațiilor de biți la stânga și la dreapta Pentru un operand x având reprezentarea biților [x„ b *"- , •••, xo], expresia x "k oferă o valoare cu reprezentarea biților [x^ b x „ * , " x , , , ] Adică, x este deplasat la stânga cu k biți, eliminând cei mai semnificativi biți ai lui k și umplând partea dreaptă a lui k cu zerouri Deplasarea trebuie să fie între și n-\ Operațiile de schimbare sunt grupate într-o direcție de la stânga la dreapta, deci x „j” k este echivalent cu (x „j)” k Nu uitați de prioritatea operatorului: " - evaluează la " ( - ), nu ( " ) - Există o operație de deplasare la dreapta corespunzătoare x » k, dar comportamentul acesteia este diferit În general, toate mașinile acceptă două forme de schimbare la dreapta: logică și aritmetică Deplasarea logică la dreapta umple marginea stângă cu zerouri, producând rezultatul [ , , , xl xn , •••, ■*>]• Deplasarea aritmetică la dreapta umple marginea stângă cu repetări ale celui mai semnificativ bit, producând rezultatul [x „ i, , x „ i, x „ i, x „ , , xj Această regulă poate părea nesemnificativă, dar Capitolul Prezentarea informațiilor și lucrul cu acestea se va vedea mai târziu că este util pentru lucrul cu date întregi semnate Standardul C nu specifică exact ce tip de schimbare la dreapta să folosească Pentru datele nesemnate (adică datele întregi declarate cu specificatorul nesemnat), deplasările la dreapta pot fi logice Pentru datele semnate (implicit), pot fi utilizate fie deplasări aritmetice, fie logice Din păcate, asta înseamnă că orice cod care ia o formă sau alta poate avea probleme de portabilitate mai târziu Cu toate acestea, așa cum arată practica, aproape toate combinațiile de compilatoare și mașini folosesc deplasări aritmetice la dreapta pentru datele semnate și majoritatea programatorilor iau acest lucru de la sine înțeles EXERCIȚIUL Completați tabelul care arată efectele diferitelor operații de schimbare asupra valorilor pe un singur octet Cel mai bun mod de a privi operațiile de schimbare este să lucrezi cu reprezentări binare Convertiți valorile inițiale în binar, efectuați schimbări și apoi convertiți înapoi în hexazecimal Fiecare răspuns trebuie să aibă cifre binare sau cifre hexazecimale X x " X" X " Shestn Hex binar Hex binar Hex binar Binar OxFO OxOF OhSS x reprezentare intreg Această secțiune descrie două moduri diferite în care biții pot fi utilizați pentru a codifica numere întregi: una dintre aceste moduri poate reprezenta doar numere nenegative, iar cealaltă poate reprezenta numere negative, numere pozitive și zero Va deveni clar pentru cititor mai târziu că acestea sunt interdependente atât în proprietățile lor matematice, cât și în implementările lor la nivel de mașină Autorii iau în considerare, de asemenea, impactul extinderii sau comprimării unui întreg codificat pentru a se potrivi unei reprezentări de lungime diferită Tipuri întregi Limbajul C acceptă diferite tipuri de numere întregi, care se disting prin intervale de numere Ele sunt prezentate în tabel Fiecare tip are un indicator de dimensiune: char, short, int și Partea I Structura și execuția programului lung, precum și un semn care indică dacă numărul este nenegativ (nesemnat) În mod implicit, întregul poate fi negativ Tipurile de reprezentare a numerelor au fost descrise în tabel Standardul C definește intervalul minim de valori pe care îl poate reprezenta fiecare tip de date O mașină tipică pe de biți utilizează o reprezentare pe de biți a tipurilor de date int și nesemnate, chiar dacă standardul C permite și reprezentări pe biți După cum se arată în tabel , Compaq Alpha folosește un cuvânt de de biți pentru a reprezenta un întreg lung, care oferă o limită superioară de peste , x pentru valorile fără semn și un interval mai mare de ± , x pentru valorile cu semn Tabelul Tipuri întregi în C Descriere C furnizată Tipic de biți Minimum Maximum Minim Maximum char - - caracter nesemnat scurt [int] - - nesemnat scurt [int] int - - nesemnat [int] lung [int] - - nesemnat lung [int] Numere semnate și nesemnate în C, C++ și Java C și C++ acceptă atât numere semnate (implicit) cât și nesemnate Java acceptă numai numere semnate Codificări semnate și cu complement binar a doi Să presupunem că există un tip întreg format din w biți Un vector de biți este scris fie ca x pentru a desemna întregul vector, fie ca [xn, b xi, , , x ] pentru a indica biții individuali din vector Când considerăm x ca un număr scris în notație binară, obținem o interpretare a lui x fără semn Această interpretare este exprimată în funcție de B UW (lungime binară w până la nesemn): /= ( ) Funcția B UW convertește șiruri de zerouri și una de lungime ѵv în numere întregi nenegative Cea mai mică valoare este reprezentată de vectorul de biți [ ] având Capitolul Prezentarea și lucrul cu informații valoare întreagă , iar cea mai mare valoare este reprezentată de vectorul de biți [ ] având valoarea întreagă UMaxw = d'- Astfel, funcția B UW poate fi definit ca maparea B UW\ { , }w -► { , d' - } Rețineți că B UW este o corespondență unu-la-unu; asociază o valoare unică cu fiecare vector de biți de lungime ѵv; invers, fiecare număr întreg din intervalul la " - are o reprezentare binară unică ca un vector de biți de lungime ѵv Pentru multe aplicații software, doriți să reprezentați și valori negative Cea mai utilizată reprezentare computerizată a numerelor cu semne se numește forma complementului a doi Este determinată de interpretarea celui mai semnificativ bit al cuvântului, care va avea o pondere negativă O astfel de interpretare este exprimată prin funcția B TW (lungime binară w la complementul a doi): w- B Tw(x)=-xw t w~'+ ( , ) /= EXERCIȚIUL Presupunând w = , fiecărei cifre hexazecimale posibile i se poate atribui o valoare numerică, presupunând interpretare fără semn sau complement în doi Completați următorul tabel conform acestor interpretări, notând puterile diferite de zero ale lui , ca în ecuațiile ( ) și ( ): X B U (x) B T (x) Shestn Binar A [ ] + ' = - + = - opt Cu F În tabel prezintă combinații de biți și valori numerice ale unor valori caracteristice pentru diferite lungimi de cuvinte Primele trei linii reprezintă intervale de numere întregi Aici merită subliniat câteva puncte În primul rând, gama de coduri suplimentare este asimetrică: \TMaxw\ = \TMaxw\ + , adică nu există un echivalent pozitiv pentru TMinw Vom vedea mai târziu că aceasta duce la manifestarea unor proprietăți speciale ale aritmeticii complementului a doi și poate fi o sursă de mici defecte software În al doilea rând, maximul Partea I Structura și execuția programului valoarea fără semn este puțin mai mare decât dublul valorii complementului a doi: UMaxw = TMaxw + Aceasta rezultă din faptul că reprezentarea complementului a doi rezervă jumătate din combinațiile de biți pentru reprezentarea valorilor negative Celelalte cazuri sunt constantele - și Rețineți că - are aceeași reprezentare de biți ca UMaxw, un șir de uni Valoarea numerică este reprezentată ca un șir de toate zerourile în ambele cazuri Tabelul Cantitatile caracteristice în reprezentare numerică și hexazecimală Cantitate Lungimea cuvântului w UMaxw OxFF OxFFFF OxFFFFFFFF OxFFFFFFFFFFFFFF TMaxw x F x FFF x FFFFFFF x FFFFFFFFFFFFFFF TMinw x - x - x - x - - OxFF OxFFFF OxFFFFFFFF OxFFFFFFFFFFFFFF x x x x Standardul C nu necesită ca numerele întregi cu semn să fie reprezentate în formă de complement a doi, dar practic toate mașinile o fac Pentru a menține portabilitatea codului, nu ar trebui să se presupună nicio gamă specială de valori reprezentabile sau modul în care acestea sunt reprezentate în afara intervalelor (vezi Tabelul ) Fișierul din biblioteca C definește un set de constante care delimitează intervalele diferitelor tipuri de date întregi pentru fiecare computer specific care rulează compilatorul De exemplu, definește constantele int max, int min și uint max, care descriu intervale de numere întregi cu semn și fără semn Pentru codul de mașină suplimentar, unde tipul de date int are w biți, aceste constante corespund valorilor TMaxw, TMinw și UMaxw Reprezentări alternative ale numerelor semnate Există alte două reprezentări standard pentru numerele semnate Cod invers La fel ca complementul în doi, cu excepția faptului că bitul cel mai semnificativ are o pondere de -( *- ) în loc de - w l: w- B OW (x) = -x^( u-' - ) + £x' ' = Capitolul , Prezentarea și lucrul cu informații Dimensiunea semnului Cel mai semnificativ bit este o cifră binară care determină dacă biții rămași trebuie ponderați pozitiv sau negativ: B S „(x) \u d (- ) x- Ambele reprezentări au proprietatea curioasă că există două codificări diferite ale numărului Pentru ambele reprezentări, [ ] este interpretat ca + Valoarea - poate fi reprezentată sub formă de valoare de semn ca [ ] și sub formă de cod invers ca [ ] În ciuda faptului că mașinile bazate pe reprezentări ale codurilor suplimentare sunt deja învechite, acestea din urmă sunt utilizate în aproape toate computerele moderne Mai mult, va fi clar că codificarea după valoarea semnului este utilizată cu numere în virgulă mobilă Pentru un exemplu, luați în considerare următorul cod: int scurt x = ; short int mx = -x; show bytes((bytejoointer) &x, sizeof(short int)); show bytes((bytejoointer) &mx, sizeof(short int)); În tabel Figura oferă reprezentările complementului celor doi și - și reprezentarea fără semn Rețineți că reprezentările de biți ale ultimelor două sunt identice Când rulează pe o mașină stupidă, acest cod afișează și cf c , indicând faptul că x are o reprezentare hexazecimală de x , în timp ce mx are o reprezentare hexazecimală de xcfc Când sunt extinse în sistemul binar, obținem combinații de biți [ ] pentru x și [ ] pentru mx După cum se arată în tabel , pentru aceste două combinații de biți, ecuația ( ) dă valorile și - Tabelul Reprezentări ale codului suplimentar pe biți Greutate - Valoare bit Valoare bit Valoare bit Partea I Structura și execuția programului Tabelul (sfârșit) Greutate - Valoare bit Valoare bit Valoare bit ± - Total - EXERCIȚIUL Capitolul va analiza listele generate de un dezasamblator, un program care convertește un fișier de program executabil într-o formă ASCII care poate fi citită de om Aceste fișiere conțin o varietate de numere hexazecimale, reprezentând de obicei valori sub formă de complement de biți Abilitatea de a recunoaște aceste numere și de a înțelege semnificația lor (de exemplu, dacă sunt negative sau pozitive) este o abilitate profesională importantă pentru orice programator Pentru liniile etichetate A-K din lista următoare, convertiți valorile hexazecimale afișate în dreapta numelor comenzilor (sub, push, mov și add) în echivalentele lor zecimale b : ec sub $ x , %esp A bd: împinge %ebx be: b mov x (%ebp), %edx B C : b d c mov Oxc (%ebp), %ebx c c : b d mov x (%ebp), %ecx D c : b fe ff ff mov xfffffe (%ebp), %eax E cd: cb add %ecx, %ebx cf: adăugați x (%edx), %eax F d : aO fe ff ff mov %eax, OxfffffeaO (%ebp) G d : b ff ff ff mov OxfffffflO (%ebp), , %eax H Capitolul Prezentarea și lucrul cu informații de: Ic mov %eax, Oxlc (%edx) I el: d c ff ff ff mov %ebx, xffffff c (%ebp) J e : b mov x (%edx), %eax K Conversia între numere semnate și nesemnate Deoarece atât B UW, cât și B TW sunt corespondențe unu-la-unu, au inversiuni bine definite Definiți U BW ca B UW'\ și T BW ca B T ~' Aceste funcții mapează combinații de biți de complement nesemnați sau doi la valori numerice Presupunând că întregul x este în intervalul d '" ), numărul este convertit într-o valoare negativă W Nesemnat Adiţional Orez Conversia unei valori din reprezentarea fără semn în complement a doi Pe scurt, se pot lua în considerare efectele conversiei în ambele direcții, între reprezentarea numărului fără semn și reprezentarea complementului a doi Pentru valorile din intervalul În tabel Figura prezintă câteva modele de expresii relaționale și evaluările lor finale, presupunând o mașină de de biți care utilizează reprezentarea complementului a doi Luați în considerare comparația - - - Semnat U > - - Nesemnat * > (int) U Semnat * - > - Semnat (nesemnat) - > - Nesemnat Notă Cazurile neevidente de transformări sunt notate în tabel cu un asterisc Trebuie să scrieți TMip ca - - și nu ca - pentru a evita depășirea Calculatorul procesează o expresie de forma -X citind mai întâi expresia X și apoi negați-o, dar este prea mare pentru a fi reprezentat ca număr de complement doi pe de biți Partea I Structura și execuția programului EN Presupunând că expresiile sunt evaluate pe o mașină de de biți folosind aritmetica complementului în doi, completați următorul tabel, descriind efectele transformărilor și operațiilor relaționale în stilul unui tabel Evaluarea tipului de expresie - - == U - - (int) U Extinderea reprezentării pe biți a unui număr O operație obișnuită este conversia între numere întregi care au lungimi de cuvinte diferite, dar care păstrează aceeași valoare numerică Desigur, acest lucru nu este posibil atunci când tipul de date țintă este prea mic pentru a reprezenta valoarea dorită Cu toate acestea, conversia unui tip de date mic într-un tip de date mare ar trebui să fie întotdeauna posibilă Pentru a converti un număr fără semn într-un tip de date mai mare, puteți adăuga pur și simplu zerouri de început la reprezentare Această operație se numește zero padding Pentru a converti un număr de complement doi într-un tip de date mai mare, se aplică regula semn-extra, cu copii ale bitului cel mai semnificativ adăugat la reprezentare Prin urmare, dacă valoarea inițială are reprezentarea biților [xw i, xw , , x ], atunci reprezentarea extinsă este de forma [xw h , xi „ , x, „ , , x ] Ca exemplu, luați în considerare Lista R?" PflMțițmrу, cr er breaking '-L ■ -• ' |, хI/ , , х ]) - B TW ([xi> |, xi> , •••> *^o] ) Extinderea părții stângi a expresiei cu ecuația ( ) dă următoarele: W I B TwrX ([х, „ ь )х! |,х„, , »х ]) =-х„ | '” + £x' ' /= n'- = -xn, I w + xw , ^' £x' ' /= și = -xwl(r- w,) + £x' ' /= m'- = -x,m n'I+ £x' ' /= = B Tw([xw hxw , ,x ]) Partea I Structura și execuția programului Proprietatea principală folosită aici a fost aceea că - “' + nd'" = - nd'" Prin urmare, efectul combinat al adăugării unui bit cu greutatea - "' și al conversiei unui bit cu greutatea - '*'" într-un bit cu greutatea este de a păstra valoarea numerică originală Este demn de remarcat faptul că ordinea relativă de conversie a datelor de la o dimensiune la alta și conversia valorilor nesemnate în valori semnate poate afecta comportamentul programului Luați în considerare următoarea adăugare la exemplul anterior din Lista I Lista Exemplu de completare / ! nesemnat uy = x;/* Misticism! */ printf("uy = %u:\t", uy); show bytes ((byte pointer) &uy, sizeof (nesemnat)); Această parte a codului imprimă următoarele: uy = :ff ff cf c Aceasta arată că expresiile (nesemnat) (int) sx/* */ Și (nesemnat) (nesemnat scurt) sx/* */ creați valori diferite, chiar dacă tipurile de date inițiale și finale sunt aceleași În prima expresie, scurtul de biți este primul semn extins într-un int de de biți, în timp ce a doua expresie realizează zero-padding EXERCIȚIUL Luați în considerare următoarele funcții C: int funl (cuvânt nesemnat) { return (int) ((cuvântul „ )” ); } int fun (cuvânt nesemnat) { return ((int) cuvânt „ )” ; } Să presupunem că rulează pe o mașină cu o lungime a cuvântului de de biți și aritmetica complementului a doi De asemenea, presupunem că deplasările la dreapta ale valorilor cu semn sunt efectuate aritmetic, în timp ce deplasările la dreapta ale valorilor fără semn sunt efectuate logic Capitolul Prezentarea și lucrul cu informații Completați următorul tabel de valori pentru aceste funcții pentru câteva exemple de argumente: funl(w) funl(w) Descrieți calculele efectuate de fiecare dintre aceste funcții Trunchierea numerelor Să presupunem că, în loc să extindem valoarea cu biți suplimentari, numărul de biți care reprezintă numărul este redus De exemplu, acest lucru se întâmplă în următorul Listare : Lista Trunchierea numerelor - int x = scurt sx = (scurt) x;/* - ★/ inty = sx;/* */ Pe o mașină normală de de biți, când x este convertit în scurt, int pe de biți este trunchiat la un int scurt de biți După cum sa menționat mai sus, această combinație de biți este reprezentarea complementului a doi a lui - Când este convertită înapoi în int, extinderea complementului semnului va converti cei biți superiori în uni, rezultând o reprezentare pe de biți a codului complementului a doi - La trunchierea unui număr de w-biți (x) = [chi> |, chi , » x ] în numărul de biți A, cei mai mari w - k biți sunt eliminați, rezultând un vector de biți x = [x^b xk , •••> xo] Trunchierea unui număr îi poate schimba valoarea - este o formă de depășire Acum luați în considerare valoarea numerică care va fi rezultatul Pentru un număr x fără semn, rezultatul trunchierii cu k biți este echivalent cu x modulo k Acest lucru poate fi văzut prin aplicarea operației de grad la ecuația ( ): B Un„ i ([х„„ x„, i, x ]) mod * mod * mod * la-\ = Z^ ' /= = B Uk([xi„xk t,x ]) Partea I Structura și execuția programului Această diferențiere folosește proprietatea ' mod k = pentru orice i > k k-\ k-\ și X /= *-! este definit pentru a efectua o schimbare logică la dreapta Valorile fără semn sunt foarte utile atunci când cuvintele sunt tratate ca doar biți fără nicio interpretare numerică Acesta este cazul, de exemplu, când se furnizează un cuvânt cu steaguri care descriu condiții booleene Adresele sunt nesemnate, astfel încât programatorii de sistem constată că tipurile nesemnate au avantajele lor Valorile fără semn sunt, de asemenea, utile în implementarea pachetelor matematice pentru aritmetica de comparare modulo și aritmetica cu precizie multiplă, unde numerele sunt reprezentate ca șiruri de cuvinte Aritmetica intregi Mulți programatori începători sunt surprinși să constate că adăugarea a două numere pozitive poate duce la un număr negativ și că compararea x > , atunci adunarea se revarsă cu efectul de creștere negativă a sumei cu Acest lucru este afișat în zona care formează înclinul avion, etichetat Overflow La executarea programelor C, apariția depășirilor nu este semnalată ca o eroare Cu toate acestea, din când în când, poate fi necesar să verificați dacă există preaplin De exemplu, să presupunem că calculați s = x + "y și doriți să determinați dacă s = x + y este adevărat Se consideră că o depășire are loc dacă și numai dacă s x, prin urmare, dacă s nu depășește, atunci rezultatul este sigur s > x Pe de altă parte, dacă este debordant, atunci rezultatul este s = x + y - 'v y , luați în considerare valoarea W -x Rețineți că acest număr este în intervalul ( Yu) EXERCIȚIUL O combinație de biți cu lungimea w = poate fi reprezentată printr-o singură cifră hexazecimală Pentru a reprezenta aceste cifre fără semn, utilizați ecuația ( ) și completați următorul tabel, furnizând mărimile și reprezentările de biți (hexazecimale) ale inverselor aditive fără semn ale cifrelor indicate Capitolul Prezentarea și lucrul cu informații X Shestn Decimal Hex Zecimal opt ȘI F incrementul de complement O problemă similară apare pentru creșterea codurilor de complement a doi Având în vedere numerele întregi x și y în intervalul - d" u~l) și s-a obținut un rezultat negativ z'^x+y- "' Analiza preliminară a arătat că atunci când operația + este aplicată la valorile x și y în intervalul - "'" , atunci incrementul are o depășire pozitivă, ceea ce face ca suma să scadă cu Fiecare dintre aceste trei intervale formează un plan înclinat în diagramă Ecuația ( ) vă permite să identificați cazurile în care are loc o depășire Când x și y sunt negative, dar x + 'w y > , atunci există o depășire negativă Când x și y sunt pozitive, dar x + y p '| nu poate fi reprezentat ca un număr de ѵv-bit Pretenim că această valoare specială este ea însăși o inversă aditivă la + 'w Capitolul Prezentarea și lucrul cu informații Valoarea - d'" + 'w - |Ж este reprezentată de al treilea caz al ecuaţiei ( ), deoarece - d" + 'u, + - "'" = - 'v Aceasta dă - u+ + \v - H'+I = - d' + "' = Din analiza efectuată, operația de negație în codul complementului a doi - 'w pentru x în intervalul - d'" - ''" ( , ) EXERCIȚIUL O combinație de biți cu lungimea w = poate fi reprezentată printr-o singură cifră hexazecimală Pentru a reprezenta aceste cifre în complement a doi, completați următorul tabel pentru a determina inversele aditive ale cifrelor afișate X Şase Decimală Decimală Şase opt ȘI G Care sunt caracteristicile combinațiilor de biți create de negația complementului a doi și negația fără semn (vezi exercițiul )? O tehnică binecunoscută pentru efectuarea negației complementului a doi la nivel de biți este completarea biților și apoi incrementarea rezultatului În C, aceasta poate fi scrisă ca + Pentru a demonstra corectitudinea acestei tehnici, rețineți că pentru orice singur bit x, există = - xh Fie x un vector de lungime w și x = B TW (x) fie numărul reprezentat de acest vector în două coduri binar Conform ecuației ( ), vectorul de biți padded ~x are următoarea valoare numerică: \v- В Т „(~x) \u d -CH - x „, i) "'' + S ( - x') ' \u d - m „ £ ” - /= -x^-' + ^x^ /= = [- ,,-'+ "”'-P-^GDx) Partea I Structura și execuția programului Principala simplificare în derivația de mai sus este aceea că £”=~ ' = m - Rezultă de aici că la incrementări, obținem -x Pentru a incrementa un număr x reprezentat la nivel de bit ca x = [xn, b xi, , x ], definiți operația de creștere după cum urmează Fie k poziția celui din dreapta zero astfel încât x să ia forma [xn b xi, , , xA+ , , , , ] Acum putem determina că incrementul ips(x) ia forma [xi, b xn, , , x*+i, , , , ] Pentru cazul special în care reprezentarea la nivel de biți a lui x este [ , , , ], definiți ipz(x) ca [ , , ] Pentru a demonstra că ips(x) oferă o reprezentare la nivel de biți a lui x + u, , luăm în considerare următoarele cazuri: □ Când (x) = [ , , , ], avem x = - Valoarea incrementală ipsg(x) = [ , , ] are o valoare numerică de □ Când k = w - , (x) = [ , , ], avem x = TMaxw Valoarea incrementală ipsg( x) = = [ , , ] are valoarea numerică TMinw Ecuația ( ) arată că TMaX" + 'w unul dintre cazurile de overflow pozitiv, dând valoarea TMIP" □ Când k > + (xy, ! y + yw-ix) u' + x|v i ^ i u] mod W ( ) = (x · y) mod "' Astfel, biții w inferiori ai x yux' y' sunt identici Partea / Structura și execuția programului Ca o ilustrare, în Tabel arată rezultatele înmulțirii diferitelor numere de trei biți Pentru fiecare pereche de operanzi la nivel de biți, sunt efectuate atât înmulțirea fără semn, cât și înmulțirea complementului a doi Rețineți că produsul trunchiat fără semn este întotdeauna x • y mod și că reprezentările la nivel de biți ale ambelor produse trunchiate sunt identice Tabelul Înmulțirea numerelor de trei biți fără semn și complement a doi Mod X Y X'Y Trunchiat l 'y Nesemnat [ ] [OH] [ ] [ ] În adaos cod - [ ] [OH] - [ ] - [ ] Nesemnat [ ] [ ] [ ] [ ] În adaos cod - [ ] - [ ] [ ] - [ ] Nesemnat [ ] [OH] [ ] [ ] În adaos cod [ ] [OH] [ ] [ ] Deși reprezentările la nivel de biți ale produselor complete pot diferi, reprezentările produselor trunchiate sunt identice și JȘ ?L L Completați următorul tabel indicând rezultatele înmulțirii diferitelor numere de trei biți conform tabelului : Mod X Y *'Y Trunchiat x -y Adăugare nesemnată cod [ ] [NU] [ ] [ ] Adăugare nesemnată cod [ ] [ ] [ ] [ ] Adăugare nesemnată cod [ ] [ ] [ ] [ ] Se poate observa că aritmetica asupra numerelor de w-biți nesemnați și aritmetica codurilor complementului doi sunt izomorfe, adică + ", -" și *" au același efect la nivel de biți ca -"și și *" w De aici putem concluziona că aritmetica codurilor complementare formează un inel se afirmă că reprezentarea la nivelul de bit x * este dată de [xiv b xi , •••> *o, O, , ], unde partea dreaptă se adaugă la zerouri Această proprietate poate fi derivată folosind ecuația ( ): wl B Uw+k ([x, „ i, xo, , ] = £x, '+* /» „n-i = - * /= = x * Pentru k *o, , , ] Conform ecuației ( ), acest vector de biți are o valoare numerică x k modulo W = x k Astfel, pentru o variabilă x fără semn, expresia x « k este echivalentă cu x * pwr k În special, se poate calcula pwr k ca U "k Pe baza acelorași argumente, se poate dovedi că pentru un număr x din codul complement a doi cu o combinație de biți [xi, b , •••" *o] și orice k în intervalul și y > rezultatul ar trebui să fie Lx/yJ, unde pentru orice număr real un L^J este definit ca un întreg unic a\ astfel încât a' v , Xo] pe k dă vectorul de biți [ , , , xi, b xi> , , xj Acest vector de biți are valoarea x' Adică, mutarea logică a unui număr fără semn la dreapta cu k este echivalentă cu împărțirea lui la k Prin urmare, pentru o variabilă fără semn x, x » k este echivalent cu x/pwr k, unde pwr k este k Acum luați în considerare efectul aplicării unei deplasări aritmetice la dreapta unui număr complementar la doi Fie x un număr întreg în complementul în doi reprezentat printr-o combinație de biți [x b x, , , x ], iar k este în intervalul , , xj și x" numărul fără semn reprezentat de cei mai puțin semnificativi k biți [x* i, »*o]- Printr-o analiză mai simplă decât în cazul numărului fără semn, avem x = *x' + x" și , analiza de mai sus arată că acest rezultat deplasat este valoarea dorită Totuși, pentru x , rezultatul împărțirii întregi trebuie să fie Γx/y!, unde pentru orice număr real a, Gai este definit ca un întreg unic a\ astfel încât a'- Prin urmare, pentru x = ) (( *X) = X * C -x | -x >= x*] / = ux*uy ~x*y + uy*ux == -y Numere în virgulă mobilă Reprezentarea în virgulă mobilă a numerelor raționale are forma V = x x Y Este util pentru efectuarea de calcule care implică numere foarte mari (|P| » ), numere foarte apropiate de (|U| » ) și, în sens general, ca o aproximare la aritmetica reală Până în anii , fiecare producător de calculatoare a inventat atât propriile reguli de reprezentare a numerelor în virgulă mobilă, cât și detaliile operațiunilor efectuate asupra acestora În plus, de foarte multe ori nu le păsa de acuratețea operațiunilor, crezând că viteza și ușurința de implementare sunt mult mai importante decât acuratețea numerică Până în , totul s-a schimbat odată cu apariția Standardului (IEEE), o metodologie atent elaborată pentru reprezentarea și efectuarea numerelor în virgulă mobilă Capitolul Prezentarea informațiilor și lucrul cu acestea operațiuni Primele încercări la această activitate au fost făcute în (sponsorizat de Intel Corporation), rezultatul a fost crearea cipului , care oferă suport în virgulă mobilă pentru procesorul Pentru a ajuta la proiectarea unui standard care ar putea suporta numere în virgulă mobilă pentru viitor procesatori, în William Kahan, profesor la Universitatea Berkeley din California, a fost invitat ca consultant I s-a dat carte albă pentru a se alătura eforturilor unei comisii de a dezvolta un standard industrial universal sub auspiciile Institutului de Ingineri Electrici și Electronici (IEEE) Comitetul a adoptat în unanimitate un standard foarte asemănător cu cel creat de Kahan pentru Intel Aproape toate computerele suportă acum un fenomen numit virgulă mobilă IEEE Acesta a fost un pas semnificativ înainte în ceea ce privește portabilitatea aplicațiilor software științifice între diferite computere Despre Institut ІЕЕЕ Institutul de Ingineri Electrici și Electronici (IEEE) este un organism profesional care acoperă toate tehnologiile electronice și informatice Publică reviste științifice, sponsorizează conferințe și organizează comitete pentru oficializarea standardelor pe subiecte de la transmisia energiei la proiectarea software-ului În această secțiune, vom lua în considerare reprezentarea unui număr în formatul IEEE în virgulă mobilă De asemenea, problemele de rotunjire nu vor fi ignorate, atunci când un număr nu poate fi reprezentat cu acuratețe într-un anumit format, motiv pentru care trebuie rotunjit în sus sau în jos Proprietățile matematice ale adunării, înmulțirii și operatorilor relaționali sunt discutate în continuare Mulți programatori consideră că cea mai bună parte a numerelor în virgulă mobilă este interesul de a le rezolva, iar cea mai proastă parte a acestora este confuzia și obscuritatea lor generală Această carte va arăta că formatul IEEE este foarte simplu și ușor de înțeles deoarece se bazează pe un set mic și consistent de principii Numere binare fracționale Primul pas pentru înțelegerea numerelor în virgulă mobilă este să luați în considerare numerele binare cu valori fracționale Mai întâi, să ne uităm la sistemul numeric zecimal mai familiar Acesta din urmă utilizează o reprezentare de forma: dmdm i d\dQ cL\cL - d n, unde fiecare cifră zecimală d este în intervalul de la la Această notație reprezintă un număr definit ca d = O' x dt i=-p Ponderea cifrelor este definită în raport cu simbolul punctului zecimal, ceea ce înseamnă că cifrele din partea stângă sunt ponderate cu puteri pozitive de , producând valori întregi, în timp ce cifrele din partea dreaptă sunt ponderate cu puteri negative de , producând valori fracționale De exemplu, , / reprezintă numărul x + x ° + x ' + x ' = - Partea I Structura și execuția programului Considerăm, prin analogie, o notație de forma bmbm i b\bQ b\b b^Pi unde fiecare cifră binară (bit) bj este în intervalul de la la O astfel de notație reprezintă numărul b, definit ca m b= 'xbi i=-n ( , ) Simbolul punctului devine acum un punct binar atunci când cifrele din partea stângă sunt ponderate cu puteri pozitive de doi, iar cele din partea dreaptă sunt ponderate cu puteri negative de două De exemplu, reprezintă numărul x + x + x ° + x + x " = + + + - + = - Din ecuația ( ) se poate înțelege cu ușurință că deplasarea unui punct binar cu o poziție la stânga are ca efect împărțirea numărului dat la doi De exemplu, în timp ce reprezintă numărul |, reprezintă numărul + + + + / = І În mod similar, mutarea unui punct binar cu o poziție la dreapta are ca efect înmulțirea numărului respectiv cu doi De exemplu, , reprezintă numărul + + + + = Rețineți că sub forma , reprezintă numere mai mici decât unu De exemplu, , reprezintă - Pentru a reprezenta astfel de cantități, folosim aici să numim abrevierea -e Cu condiția să fie luate în considerare numai codificări cu lungime finită, nu este posibil să se reprezinte cu acuratețe numere precum I și - în notație zecimală Astfel, în notație binară fracțională, pot fi reprezentate doar numere care pot fi scrise ca x x codifică mantisa lui M, dar valoarea codificată depinde și de dacă câmpul flotant este sau nu În formatul convențional de precizie în virgulă mobilă (float în C), câmpurile s, exp și frac sunt D = , n = de biți fiecare, dând o reprezentare pe de biți În formatul cu virgulă mobilă cu precizie dublă (dublu în C), câmpurile S, exp și frac sunt , k = și = de biți fiecare, dând o reprezentare pe de biți Valoarea codificată de o anumită reprezentare de biți poate fi împărțită în trei opțiuni diferite, în funcție de valoarea exp Prevestiri normalizate Acesta este cazul cel mai general Valori similare apar atunci când combinația de biți exp nu este nici zerouri (valoarea numerică ) nici oricare (valoarea numerică pentru precizie simplă, pentru precizie dublă) În acest caz, câmpul cu virgulă mobilă este tratat ca reprezentând un întreg cu semn în formă deplasată Exponent E = e - Bias (offset), unde e este un număr fără semn având o reprezentare de bit eb \ eie , iar Bias este o valoare părtinitoare egală cu * i - ( pentru precizie simplă, pentru precizie dublă ) Această expansiune produce ordine de la - la + pentru precizie simplă și de la - la + pentru precizie dublă Câmpul numerelor fracționale frac este considerat ca reprezentând o valoare fracțională / unde , adică cu un punct binar în stânga celui mai semnificativ bit Mantisa este definită ca M = +/ Aceasta este uneori numită reprezentarea implicită a unității conducătoare, deoarece M poate fi gândit ca un număr cu o reprezentare binară de /m,L- Yo- Această reprezentare este o mod de a obține în mod liber un plus de precizie, deoarece exponentul E poate fi întotdeauna ajustat astfel încât mantisa lui M să fie în intervalul și, prin urmare, este imposibil să se reprezinte De fapt, reprezentarea cu virgulă mobilă + , are un model de biți care constă din toate zerourile: bitul de semn este , câmpul cu virgulă mobilă este toate zerourile (indicând o valoare nenormalizată), iar câmpul numărului fracționar este, de asemenea, toate zerourile, furnizând M =f= Interesant, când bitul de semn este unul și toate celelalte câmpuri sunt zero, atunci obținem - , În formatul IEEE cu virgulă mobilă, valorile - , și + , sunt tratate ca diferite în unele cazuri și la fel în altele A doua funcție a numerelor nenormalizate este de a reprezenta numere foarte apropiate de , Ele oferă proprietatea de a tinde uniform spre zero, în care posibilele valori numerice sunt distanțate uniform în jurul valorii de , Semnificații speciale Ultima categorie de valori apare atunci când câmpul în virgulă mobilă este format din toate Când câmpul numărului fracționar este format din toate zerourile, valorile rezultate reprezintă infinit: fie +oo când = , fie -oo când = Infinitul poate reprezenta rezultate debordante, ca atunci când înmulțiți numere foarte mari sau împărțiți la zero Când câmpul numărului fracționar este diferit de zero, atunci valoarea rezultată se numește NaN (prescurtare de la „Not a Number”) Astfel de valori sunt returnate ca rezultat al unei operații în care rezultatul nu poate fi reprezentat printr-un număr real sau ca infinit, similar calculelor J-L sau oo-oo Ele pot fi utile și în unele aplicații software atunci când reprezintă inițializarea datelor Cifre aproximative Pe fig Figura prezintă un set de valori care pot fi reprezentate într-un format ipotetic de biți având k = biți exponenți și u = biți mantise Offset-ul este О - = Toate valorile reprezentabile (altele decât NaN) sunt afișate în partea de sus a diagramei Plus și minus infinitul sunt la ambele capete ale circuitului Numere normalizate cu o valoare maximă de ± Numerele nenormalizate sunt grupate în jurul valorii de Ele sunt mai clar vizibile în a doua parte a diagramei, unde sunt afișate doar numerele din intervalul de la - , la + , Două zerouri sunt cazuri speciale de numere nenormalizate Rețineți că numerele reprezentate sunt distribuite inegal În tabel Figura prezintă câteva exemple pentru un format ipotetic în virgulă mobilă de biți având k = biți exponenți și u = biți mantise Decalajul este de " - = Tabelul este împărțit în trei regiuni, reprezentând trei clase de numere Cele mai apropiate de zero sunt numerele nenormalizate care încep de la zero Numerele nenormalizate în acest format au E = - = - , cu ponderea e = - Fracțiile f sunt în intervalul , -, , -, dând numerele V în intervalul de la la - * = / opt Capitolul Prezentarea și lucrul cu informații Tabelul Un exemplu de format ipotetic de biți Descriere Reprezentare biți e E f m V Zero •o - Cel mai puțin pozitiv - £ £ - - - Cel mai mare nenormalizat - Cel mai mic normalizat - - it dar - M IT - Unitatea dar Maxim normalizat Infinit - - - - + În tabel au și cele mai mici numere normalizate în acest format E = - = - și fracțiile sunt în intervalul , |, , Cu toate acestea, mantisele variază de la + = la + = dând V numere cuprinse între - și - Partea I Structura și execuția programului gamă completă Valori cuprinse între - , și + , - + ° - - , - , - , - , + , + , + , + , + Orez Valori reprezentabile pentru formatul în virgulă mobilă pe biți Observați tranziția ușoară între cel mai mare număr nenormalizat și cel mai mic număr normalizat Această blândețe este oferită de această definiție a lui E pentru valorile nenormalizate Setarea bias-ului la - Bias în loc de -Bias compensează faptul că mantisa numărului denormalizat nu are o unitate de conducere implicită Pe măsură ce ordinea cifrelor crește, obținem valori normalizate mult mai mari, trecând de la , până la cel mai mare număr normalizat Acest număr este de ordinul E= , oferind o pondere de /:= Fracția este egală dând mantisa Mat Deci valoarea numerică este Ieșirea din interval are ca rezultat un depășire + oo Una dintre proprietățile interesante ale acestei reprezentări este că dacă luăm în considerare reprezentările pe biți ale valorilor prezentate în tabel ca numere întregi fără semn, ele apar în ordine crescătoare, la fel ca și valorile reprezentate prin numere în virgulă mobilă Și aceasta nu este o coincidență: formatul IEEE a fost conceput astfel încât să devină posibilă sortarea numerelor în virgulă mobilă folosind procedura de rutină pentru sortarea numerelor întregi O ușoară complicație apare la manipularea numerelor negative, deoarece acestea au un înainte și apar în ordine descrescătoare; totuși, această dificultate poate fi depășită fără a fi nevoie de operații în virgulă mobilă pentru a efectua comparații (vezi Exercițiul ) EXERCIȚIUL Luați în considerare o reprezentare în virgulă mobilă bazată pe IEEE pe biți cu un bit semn, doi biți exponenți (k = ) și doi biți fracționali (n = ) Decalajul comenzii este " - = Următorul tabel listează întregul interval de numere nenegative pentru o anumită reprezentare în virgulă mobilă pe biți Completați tabelul folosind următoarele instrucțiuni: Capitolul , Prezentarea și lucrul cu informații □ e este valoarea exponentului ca întreg fără semn; □ E—valoarea comenzii după offset; □ f—valoarea fracţiei; □ M—valoarea mantisei; □ Și este valoarea numerică reprezentată Exprimați valorile lui f M și V ca fracții sub forma x/ Celulele cu liniuță nu trebuie completate Biți e E f m V ȘI — — — — +oo și — — — — și — — — — — — — — În tabel Figura prezintă reprezentările și valorile numerice ale unor numere importante în virgulă mobilă cu precizie simplă și dublă Ca și în cazul formatului de biți prezentat în tabel , aici puteți vedea câteva proprietăți generale pentru reprezentarea numerelor în virgulă mobilă cu exponent ^-bit și o fracțiune de lungime n biți Partea I Structura și execuția programului □ Valoarea + , are întotdeauna o reprezentare de biți constând din toate zerourile □ Cea mai mică valoare pozitivă nenormalizată are o reprezentare de bit constând dintr-un unu în poziţia de bit cel mai puţin semnificativă (toate celelalte sunt zerouri) Valoarea fracției (și a mantisei) este egală cu M=f= ", iar valoarea ordinului E = - k~} + Prin urmare, valoarea numerică V = "" ' □ Cea mai mare valoare nenormalizată este reprezentarea formată din câmpul exponent (toate zerourile) și câmpul fracției (toate cele) Are valoarea fracției (și mantisei) M = /= - ~" (scrisă ca ) și valoarea ordinului E = - *~ + Eu și l Prin urmare, valoarea numerică Și \u d ( - ") x ", care nu este cu mult mai mică cea mai mică valoare normalizată □ Valoarea normalizată cea mai puțin pozitivă are o reprezentare de bit cu unul în bitul cel mai puțin semnificativ în câmpul exponent (toate celelalte sunt zerouri) Valoarea mantisei M = , iar valoarea ordinului E = - k~' + Prin urmare, ^*— ' valoarea numerică V= + □ Valoarea are o reprezentare de biți cu toți , cu excepția bitului cel mai semnificativ din câmpul exponent (toți ceilalți biți sunt ) Valoarea mantisei este M = , iar valoarea ordinului este E = □ Cea mai mare valoare normalizată are o reprezentare de biți cu un bit de semn egal cu , bitul cel mai puțin semnificativ din ordin egal cu (toți ceilalți biți sunt egali cu ) Valoarea fracției / \u d - 'L, care dă mantisei M \u d - ~ n (care este scrisă în tabel ca ( - bi) ) x *" - ( - ) """ ) x *' Tabelul Exemple de numere nenegative în virgulă mobilă Descriere exp frac Single Precision Double Precision Valoare Decimală Valoare Decimală Zero Cel mai mic nenormalizat - x - , x " ' x ' , x IO' Maxim nenormalizat (primul)* “ , x IO' ( -b)x ' , x IO' Cel mai mic normalizat x " , x IO- x ' , x ' Unitatea x ° x ° Maxim normalizat (al doilea) х , х ( - ) х , х Capitolul Prezentarea informațiilor și lucrul cu acestea Un exercițiu util pentru înțelegerea reprezentărilor în virgulă mobilă este conversia valorilor întregi ale eșantionului în formă de virgulă mobilă De exemplu, în tabel s-a văzut că are reprezentarea binară [ ] Creăm reprezentarea sa normalizată prin deplasarea a locuri la dreapta punctului binar, ceea ce dă = , x Pentru a o codifica în format IEEE de precizie unică, construim câmpul fracției eliminând cel din față și adăugând zerouri la final, care dă reprezentarea binară [ ] Pentru a construi câmpul de comandă, offset-ul este adăugat la , rezultând , care are reprezentarea binară [ ] După concatenarea cu bitul de semn pentru a obține reprezentarea binară a numărului în virgulă mobilă [ ] Reamintim din Secțiunea , care a analizat relația dintre reprezentările la nivel de biți ale valorii întregi ( x ) și valoarea în virgulă mobilă cu precizie unică ( x OE ): ************ OE OO Acum puteți vedea că zona raportului corespunde celor mai puțin semnificativi biți ai întregului, care se termină chiar înaintea celui mai semnificativ bit, egal cu (acest bit formează unul implicit lider), care se potrivește cu cei mai semnificativi biți din partea fracționară a reprezentarea numărului în virgulă mobilă EXERCIȚIUL După cum sa menționat deja în ex , întregul are o reprezentare hexazecimală de x , în timp ce numărul cu virgulă mobilă de precizie unică are o reprezentare hexazecimală de x A C Produceți reprezentarea în virgulă mobilă dată și explicați relația dintre biții reprezentării întregi și reprezentarea în virgulă mobilă EXERCIȚIU NIE , Pentru un format în virgulă mobilă cu un exponent de k biți și o fracțiune de n biți, formulați formula pentru cel mai mic număr întreg pozitiv care nu poate fi reprezentat exact (deoarece ar necesita o fracție și + biți pentru o precizie deplină) Care este valoarea numerică a acestui număr întreg în format de precizie unică (k = , u = )? rotunjire Aritmetica în virgulă mobilă aproximează doar aritmetica reală, deoarece această reprezentare are o gamă și o precizie limitate Prin urmare, pentru valoarea lui x, de regulă, este necesar să se sistematizeze Partea I Structura și execuția programului o metodă de a găsi „cea mai apropiată” valoare potrivită a lui x\ care ar putea fi reprezentată în formatul dorit în virgulă mobilă Are de-a face cu operația de rotunjire Problema cheie aici este determinarea direcției de rotunjire a unei valori care se află la intersecția dintre două opțiuni De exemplu, cineva are , USD în buzunar și dorește să-l rotunjească la cel mai apropiat dolar întreg Rezultatul ar trebui să fie USD sau USD? Este Există o abordare alternativă: Mențineți limitele superioare și inferioare ale numărului real De exemplu, puteți defini valorile reprezentabile x și x, astfel încât x să fie garantat a fi undeva între: x b, atunci x + a > x + b pentru orice valori ale a, b și x, altele decât NaN Această proprietate a creșterii reale (și întregului) nu se aplică Capitolul Prezentarea și lucrul cu informații nici la creșterea numerelor fără semn și nici la creșterea numerelor în complement a doi Înmulțirea în virgulă mobilă respectă și multe dintre proprietățile asociate în mod obișnuit cu înmulțirea - proprietățile unui inel Fie x y rotund (x x y) Când este înmulțită, această operație este închisă (deși poate avea ca rezultat infinit sau NaN), este comutativă și are , ca identitate multiplicativă Pe de altă parte, nu este asociativă din cauza posibilității de depășire sau pierdere a preciziei din cauza rotunjirii De exemplu, pentru un singur număr cu virgulă mobilă de precizie, expresia ( e * e ) * e- va avea ca rezultat +oo, în timp ce rezultatul lui e * ( e * e- ) va fi e În plus, înmulțirea numerelor în virgulă mobilă nu se aplică la creșterea (adunarea) De exemplu, pentru un singur număr cu virgulă mobilă de precizie, expresia e * ( e - e- ) ar avea ca rezultat , , în timp ce e * e - e- * e ar avea ca rezultat NaN Pe de altă parte, multiplicarea în virgulă mobilă satisface următoarele proprietăți de monotonitate pentru orice valori ale lui a, b și c, altele decât NaN: □ a > și c > => a*f c > b c □'a> c a c atâta timp cât un ț NaN După cum sa menționat, niciuna dintre aceste proprietăți de monotonitate nu este valabilă pentru înmulțirea numerelor fără semn sau pentru înmulțirea numerelor complementului doi Această lipsă de asociativitate și distributivitate este un motiv de îngrijorare serioasă în rândul programatorilor științifici și dezvoltatorilor de compilatoare, deoarece rezolvarea chiar și a unei sarcini atât de aparent simple precum scrierea codului pentru a determina dacă două linii se intersectează în spațiul tridimensional poate deveni o problemă serioasă virgulă mobilă în C C oferă două tipuri de date în virgulă mobilă: fioat și double Pe mașinile care acceptă standardul IEEE în virgulă mobilă, aceste tipuri de date corespund cu virgulă mobilă de precizie simplă și dublă În plus, aceste mașini folosesc un mod rotund spre par Din păcate, deoarece standardul C nu necesită utilizarea nativă a standardului IEEE, nu există metode standard pentru schimbarea modului de rotunjire și nici pentru obținerea unor valori parțiale precum - , +oo, -oo sau NaN Majoritatea sistemelor oferă o combinație de fișiere include („ h”) și biblioteci de rutină pentru a oferi acces la aceste funcții, dar fiecare sistem are „trucurile” sale De exemplu, compilatorul GNU gcc definește macrocomenzile Infinity (pentru +oo) și nan (pentru NaN) atunci când apare următoarea secvență într-un fișier de program: #define GNU SOURCE #include Partea I Structura și execuția programului WU EN ȘI E Completați definițiile macro pentru a crea următoarele duble: -oo, -oo și #define POS INFINITY #define NEG INFINITY #define NEG ZERO #endif Fișierele Include (cum ar fi math h) nu pot fi folosite, dar se poate profita de faptul că cel mai mare număr finit care poate fi reprezentat cu precizie dublă este de ordinul , *IO La conversia valorilor între formatele int, float și double, programul modifică valorile numerice și reprezentările de biți după cum urmează (presupunând un int de de biți): □ De la int la float, un număr nu poate depăși, dar poate fi rotunjit □ O valoare numerică exactă poate fi stocată de la un int sau float la un double, deoarece double are atât un interval mai mare (adică, intervalul de valori reprezentabile) cât și o precizie mai mare (adică, numărul de cifre semnificative) □ De la dublu la float, valoarea poate depăși până la -°o sau -oo deoarece intervalul este mai mic În caz contrar, valoarea poate fi rotunjită din cauza unui grad mai mic de precizie □ De la float sau double la int, valoarea va fi trunchiată la zero De exemplu, , va fi convertit în și - , va fi convertit în - Rețineți că acest comportament este foarte diferit de rotunjire Mai mult, această valoare poate provoca o depășire Standardul C nu stabilește un rezultat fix pentru acest caz, dar pe majoritatea mașinilor rezultatul va fi fie TMaxw, fie TMinw, unde vv este numărul de biți dintr-un int Aritmetică în virgulă mobilă Intel IA În următorul capitol, ne vom aprofunda în procesoarele Intel IA care alimentează majoritatea computerelor moderne Acest lucru evidențiază caracteristicile distinctive ale unor astfel de mașini, care pot afecta grav comportamentul programelor în virgulă mobilă atunci când sunt compilate cu GCC La fel ca majoritatea procesoarelor, procesoarele IA au elemente speciale de memorie numite registre pentru a stoca valori în virgulă mobilă pe măsură ce sunt calculate și utilizate Valorile stocate în registre pot fi citite și scrise mai rapid decât cele stocate în memoria principală O caracteristică neobișnuită a IA este că registrele cu virgulă mobilă folosesc un format special de înaltă precizie de de biți pentru a oferi o gamă și o precizie mai mare decât formatele convenționale de precizie simplă și dublă de de biți și, respectiv, de de biți, utilizate pentru valorile stocate După cum este descris în ex , Capitolul , Prezentarea și lucrul cu informații Reprezentarea cu precizie crescută este similară cu formatul IEEE în virgulă mobilă cu exponent de biți (adică k = ) și fracțiune de de biți (adică u = ) Toate numerele cu precizie simplă și dublă sunt convertite în acest format pe măsură ce sunt încărcate din memorie în registrele cu virgulă mobilă Operațiile aritmetice sunt întotdeauna efectuate în modul de înaltă precizie Numerele sunt convertite din format de înaltă precizie în formate de precizie simplă sau dublă pe măsură ce sunt stocate în memorie Această extindere la de biți pentru toate datele din registru și apoi comprimarea tuturor datelor stocate în memorie într-un format mai mic provoacă consecințe nedorite pentru programatori Aceasta înseamnă că stocarea unei valori în memorie și apoi rechemarea acesteia poate schimba valoarea în sine, din cauza rotunjirii, dispariției sau depășirii O astfel de salvare și recuperare nu este întotdeauna vizibilă pentru programator, iar rezultatele pot fi imprevizibile Următorul exemplu ilustrează această proprietate reteta dubla (int denom) { return (dublu) denom; } cinci void do nothing () { }/* Numai nume ♦/ void testl (int denom) nouă { dublu rl, r ; int tl, t ; rl = reteta (denom); /♦ Stocat în memorie ♦/ r = recip(denom);/* Stocat în registru */ tl = rl = r ; /* Comparați registrul cu memoria */ do nothing O;/* Forțează registrul să fie stocat în memorie */ t = rl = r ; /* Compară memoria cu memoria */ printf ("testl tl: rl %f %c= r %f\n", rl, tl ? '=' : r ); printf ("testl t : rl %f %c= r %f\n", rl, t ? '=' : '!', r ); douăzeci } Variabilele rl și r sunt calculate de aceeași funcție cu același argument Vă puteți aștepta să fie la fel Mai mult decât atât, variabilele rl și r sunt calculate prin evaluarea expresiei rl == r și, prin urmare, se poate aștepta să fie egale cu Nu există efecte secundare ascunse evidente: funcția recip efectuează un calcul back-to-back și , judecând după nume nu face nimic, funcția nu face nimic efectuează Cu toate acestea, atunci când fișierul este compilat cu indicatorul de optimizare - și rulat cu argumentul , se obține următorul rezultat: Partea I Structura și execuția programului testl tl: rl , != r , testl t : rl , != r , Primul test indică faptul că cele două reciproce sunt diferite, în timp ce al doilea test indică faptul că sunt aceleași! Evident, acest lucru nu este ceea ce era de așteptat Înțelegerea tuturor detaliilor acestui exemplu necesită studierea codului în virgulă mobilă la nivel de mașină generat de gcc (vezi Secțiunea ), dar comentariile din cod sugerează de ce rezultatul este ceea ce este Valoarea calculată de funcția hep returnează rezultatul într-un registru cu virgulă mobilă De îndată ce procedura testl apelează orice funcție, aceasta trebuie să stocheze orice valoare în modul curent în registrul în virgulă mobilă al stivei principale de programe, care stochează variabilele locale ale funcției Atunci când efectuează o astfel de salvare, procesorul convertește valorile registrului de înaltă precizie în valori de memorie cu precizie dublă Prin urmare, până la al doilea apel la gepi (linia ), variabila gi este convertită și stocată ca dublu După al doilea apel, r are valoarea de înaltă precizie returnată de funcție Când se calculează tl (linia ), numărul de precizie dublă rl este comparat cu numărul de precizie crescută r Deoarece nu poate fi reprezentat exact în niciun format, rezultatul testului este fals Înainte de a apela funcția nu face nimic (linia ), r este convertit și stocat ca număr de dublă precizie Calculul lui t (linia ) compară două duble, dând rezultatul adevărat Acest exemplu demonstrează defectul gcc atunci când rulează pe mașini cu un procesor Intel IA (același rezultat pentru Linux și Microsoft Windows) Valoarea este asociată cu modificări ale variabilei din cauza operațiunilor care nu sunt vizibile pentru programator, cum ar fi salvarea și restaurarea registrelor în virgulă mobilă Experimentele cu compilatorul Microsoft Visual C++ indică faptul că nu se confruntă cu aceste probleme De ce să fii atent la inconsecvență? Capitolul discută unul dintre principiile fundamentale ale optimizării compilatorului: programele ar trebui să producă exact aceleași rezultate indiferent dacă optimizarea este activată sau nu Din păcate, GCC nu îndeplinește această cerință pentru codul în virgulă mobilă pe mașinile cu procesor Intel IA Există mai multe modalități de a rezolva această problemă, deși niciuna dintre ele nu este ideală Cel mai simplu, apelați gcc cu opțiunea de linie de comandă ffioat-store, care specifică că rezultatul fiecărui calcul în virgulă mobilă ar trebui să fie stocat în memorie și citit înainte de utilizare, mai degrabă decât doar stocat într-un registru În acest caz, fiecare valoare calculată va fi convertită într-un formular cu precizie redusă Într-o anumită măsură, acest lucru încetinește programul, dar comportamentul acestuia devine mai previzibil Din păcate, s-a constatat că gcc nu respectă cu strictețe regula de citire după scriere, chiar și atunci când i se oferă o opțiune de linie de comandă De exemplu, luați în considerare următoarea funcție din Lista - Capitolul Prezentarea și lucrul cu informații test de gol (int denum) { rl dublu; int tl; rl = recip(denom);/* Implicit: înregistrare, salvare forțată: memorie */ tl = rl = / / (dublu) denumire;/* Comparați registrul sau memoria cu înregistrarea */ printf ("test tl: rl %f %c= / \n", rl, tl ? '=' : '!'); opt } Când este compilat doar cu opțiunea - , tl este setat la : sunt comparate două valori de registru Când este compilat cu indicatorul -ffioat-store, tl este setat la ! Deși rezultatul apelului la herere este scris în memorie și citit într-un registru, valoarea calculată de , /(dublu) denum este stocată într-un registru În general, s-a constatat că modificările aparent minore ale programului pot cauza succes sau eșec imprevizibil al acestor teste Alternativ, puteți face ca gcc să folosească precizia crescută în toate calculele declarând toate variabilele ca long double (lista - ) rețetă dublă lungă l (int denum) { return / (long double) denom; } cinci void test (denumire int) { rl dublu lung, r ; int tl, t , t ; rl = recip l(denom);/* Stocat în memorie */ r = recip l(denom);/* Stocat în registru */ tl = rl = r ; /* Comparați registrul cu memoria */ do nothing O;/* Forțează stocarea unui registru în memorie */ t = rl = r ; /* Compară memoria cu memoria */ t = rl = , / (long double) denom; /* Comparați memoria cu înregistrarea */ printf ("test tl: rl %f %c= r %f\n", (dublu) rl, tl ? '=' : '!', (dublu) r ); printf("test t : rl %f %c= r %f\n", (dublu) rl, t ? '=' : '!', (dublu) r ); Partea / Structura și execuția programului printf("test t : rl %f %c= / \n", (dublu) rl, t ? '=': } Declarația dublă lungă este legală ca parte a standardului ANSI C, deși pe majoritatea mașinilor și compilatoarelor această declarație este echivalentă cu o dublă obișnuită Cu toate acestea, gcc pe mașinile IA utilizează un format de înaltă precizie pentru informațiile de memorie și datele de registru în virgulă mobilă Acest lucru vă permite să profitați din plin de gama mai largă și de precizia pe care le oferă acest format, evitând în același timp variația observată în exemplele anterioare Din păcate, această soluție este destul de scumpă Pentru a stoca un dublu lung, gcc folosește octeți, mărind cantitatea de memorie cu % ( octeți ar fi suficienți, dar rotunjiți la pentru a îmbunătăți eficiența memoriei Aceeași alocare este folosită pe mașinile Linux și Windows) Transferul de date mai lungi între registre și memorie necesită mai mult timp, dar este totuși cea mai bună alegere pentru programele care necesită cele mai precise și previzibile rezultate Aranjați : Costul de depășire în virgulă flotantă Conversia floaturilor mari în numere întregi este o sursă majoră de erori de programare Greșeli ca acestea au avut consecințe dezastruoase pentru prima lansare a rachetei Ariana pe iunie La de secunde după lansare, racheta a deviat de la curs, s-a rupt și a explodat Costul sateliților de comunicații de la bord a fost de aproximativ de milioane de dolari În timpul anchetei [ ], s-a dovedit că computerul care controlează sistemul de navigație inerțial a trimis date incorecte către computerul care controlează duzele În loc să se trimită informații de control al zborului, a fost trimis un model de biți de diagnosticare care indică faptul că a avut loc o depășire în timpul conversiei unui număr în virgulă mobilă de de biți într-un număr semnat de biți Valoarea de preaplin a măsurat viteza orizontală a rachetei, care ar putea fi de cinci ori viteza dezvoltată de racheta anterioară Ariana La dezvoltarea software-ului pentru aceasta, valorile numerice au fost analizate cu atenție și s-a ajuns la concluzia că viteza orizontală ar fi nu depășește niciodată un număr de biți Din păcate, în Arman această bucată de software a fost pur și simplu reutilizată fără a verifica ipotezele pe care s-a bazat EXERCIȚIUL Să presupunem că variabilele x, f și d sunt de tip int, float și, respectiv, double Valorile lor sunt arbitrare, cu excepția faptului că nici f, nici d nu sunt egale cu +oo, -oo sau NaN Demonstrați pentru fiecare dintre următoarele expresii C că acestea vor fi întotdeauna adevărate (adică, egale cu ) sau setați variabilele la o astfel de valoare încât expresia să nu fie adevărată (adică, egală cu ) Capitolul Prezentarea informațiilor și lucrul cu acestea x = (int) (fioat) x X == (int) (dublu) x f == (fioat) (dublu) f d == (fioat) d f == - (-f) , / == / , (d > = , ) ((d* ) = beyondjnsb este zero când lungimea cuvântului = lățimea tipului Unde codul scris nu este conform standardului C? Modificați codul astfel încât să ruleze corect pe orice computer pentru care int are cel puțin de biți Modificați codul astfel încât să ruleze corect pe orice computer pentru care int are cel puțin biți Capitolul Prezentarea informațiilor și lucrul cu acestea IMPORTANT , ♦ Ați primit un loc de muncă la o companie care implementează un set de proceduri pentru lucrul cu o structură de date în care patru octeți semnați sunt împachetati într-un format nesemnat de de biți Octeții dintr-un cuvânt sunt numerotați de la (cel mai puțin semnificativ) la (cel mai semnificativ) Sarcina este de a implementa o funcție pentru o mașină cu aritmetică în complement a doi și cu deplasări aritmetice la dreapta conform următoarelor prototipuri: /* Declarație de tip de date, unde octeți sunt împachetati în unsigned (unsigned) */ typedef unsigned packed t; /* Extrage un octet dintr-un cuvânt Reveniți ca un întreg cu semn */ int xbyte(cuvânt t ambalat, int octet) { întoarcere (cuvânt" (bytenum " )) & OxFF; } Ce este greșit în acest cod? Scrieți o implementare corectă a funcției care utilizează doar deplasări la dreapta și la stânga cu o singură scădere EXERCIȚIUL ♦ Completați următorul tabel arătând efectele umpluturii și incrementării mai multor vectori de biți (cum ar fi Tabelul ) Afișați atât vectorii de biți, cât și valorile numerice X ipsg (~ x) [ ] [ ] [ ] [ ] [ ] EXERCIȚIUL ♦♦ Demonstrați că prima scădere și adunarea ulterioară sunt echivalente cu adunarea urmată de creștere Adică, pentru orice valoare x semnată, expresiile -x, ~x+ și ~(x- ) produc aceleași rezultate Pe ce proprietăți matematice ale adunării în codul complement a doi se bazează concluzia? Partea I Structura și execuția programului EXERCIȚIUL ♦♦♦ Să presupunem că vrem să calculăm o reprezentare de U biți a lui x-y, unde x și y sunt valori nesemnate, pe o mașină al cărei tip de date nesemnate este w-bit Cei mai puțin semnificativi biți ai produsului pot fi calculați prin x * y, deci este necesară doar procedura prototipului unsigned int unsigned high prod(unsigned x, unsigned y); calcularea biților x-y înalți cu w pentru variabilele fără semn Există acces la o funcție de bibliotecă cu următorul prototip: int signed high prod (int x, int y); calculând biții w superiori ai x • y pentru cazul în care xiy este sub formă de complement a doi Scrieți cod care apelează această procedură pentru a implementa funcția pentru argumente nesemnate Justificați corectitudinea deciziei dvs Cheie' Observați relația dintre produsul x-y cu semn și produsul x’-y’ fără semn în derivarea ecuației ( ) EXERCIȚIUL Să presupunem că vi se dă sarcina de a crea un cod pentru înmulțirea unei variabile întregi x cu diverși factori constanti k Pentru o eficiență mai mare, trebuie să utilizați numai operațiile - și " Scrieți expresii de înmulțire pentru următoarele valori ale lui k, folosind nu mai mult de trei operații per expresie k \u d \ k = ; k= ; k \u d - EXERCIȚIUL ♦♦ Scrieți expresii C pentru a crea următorul model de biți, unde ak reprezintă k repetiții ale caracterului a Să presupunem tipul de date pe w-biți Codul poate conține referințe la parametrii j și k, reprezentând valorile j și k, dar nu și parametrul care reprezintă w G "* *; o'^W EXERCIȚIUL ♦ ♦ Să presupunem că octeții dintr-un cuvânt pe w-biți sunt numerotați de la (cel mai puțin semnificativ) la w/ -l (cel mai semnificativ) Scrieți codul pentru o funcție care returnează o valoare fără semn, astfel încât octetul i al argumentului x să fie înlocuit cu octetul b: unsigned replace byte(unsigned x, int i, unsigned char b); Capitolul Prezentarea informațiilor și lucrul cu acestea Următoarele exemple arată cum ar trebui să funcționeze funcția: înlocuiți octeți( x , ,, xAB) -> x AB înlocuiți octeți( x , ,, xAB) -> x baAB EXERCIȚIUL ♦♦♦ Scrieți codul pentru următoarele funcții C Funcția srl efectuează o deplasare logică la dreapta folosind o deplasare aritmetică la dreapta (reprezentată de valoarea xsra), urmată de restul operațiilor, cu excepția deplasărilor la dreapta sau a diviziunii Funcția sra efectuează o deplasare aritmetică la dreapta folosind o deplasare aritmetică la dreapta (reprezentată de valoarea xsri), urmată de restul operațiilor, cu excepția deplasărilor la dreapta sau a diviziunii Putem presupune că lungimea tuturor inturilor este de de biți Suma schimburilor la poate varia de la la unsigned srl (nesemnat x, int k) { /* Faceți deplasarea aritmetică */ unsigned xsra = (int) x » k; int sra (int x, int k) { /* Faceți schimbarea logic */ EXERCIȚIUL ♦ Programele rulează pe mașini în care valorile int sunt de de biți Ele sunt reprezentate în complement a doi și deplasate aritmetic la dreapta Valorile de tip nesemnat sunt, de asemenea, de de biți Să generăm valori arbitrare x și y și să le convertim în alte valori fără semn /* Creați niște valori arbitrare */ int x = aleatoriu(); int y = aleatoriu(); /* Convertiți în valori nesemnate */ nesemnate-le = (nesemnate) x; nesemnat uy = (nesemnat) y; Pentru fiecare dintre următoarele expresii C, trebuie să indicați dacă expresia produce sau nu întotdeauna Dacă da, descrieți principiile matematice din spatele acesteia Dacă nu, dați un exemplu de argumente pentru care returnează Partea I Structura și execuția programului (x -y) ((x+y)" ) + y-x == *y+ *x ~x + ~y = ~ (x + y) (int) (ux-uy) = -(y-x) ((x» ) « ) - Cel mai mare nenormalizat -oo - - - Număr în notație hexazecimală ZAO — EXERCIȚIUL ♦ Programele rulează pe o mașină în care valorile int au o reprezentare a complementului în doi pe de biți Floaturile folosesc formatul IEEE pe de biți, iar dublele folosesc formatul IEEE pe de biți Valorile întregi arbitrare x, y, z sunt generate și convertite în alte duble după cum urmează: /* Creați niște valori arbitrare */ int x = aleatoriu(); int y = aleatoriu(); int z = aleatoriu(); /* Convertiți în dublu */ doubledx = (dublu)x; doubledy = (dublu) y; doubledz = (dublu) z; Pentru fiecare dintre următoarele expresii C, trebuie să indicați dacă expresia produce sau nu întotdeauna Dacă da, descrieți principiile matematice din spatele acesteia Dacă nu, dați un exemplu de argumente pentru care returnează Rețineți că nu puteți utiliza mașina IA cu gcc pentru a testa răspunsurile, deoarece va folosi reprezentarea de înaltă precizie pe de biți atât pentru float, cât și pentru double (dublu) (plutitor) x == dx dx + dy = (dublu) (y+x) Capitolul Prezentarea și lucrul cu informații dx + dy + dz == dz + dy + dx dx + dy + dz == dz + dy + dx dx / dx == dy / dy EXERCIȚIUL ♦ Având în vedere sarcina de a scrie o funcție C pentru a calcula reprezentarea în virgulă mobilă a x Este clar că cea mai bună modalitate este de a construi direct o reprezentare IEEE a rezultatului cu o singură precizie Dacă x este prea mic, atunci rutina va returna , Dacă x este prea mare, atunci +oo va fi returnat Completați locurile lipsă din lista de coduri pentru a calcula rezultatul corect Să presupunem că funcția u f returnează o valoare în virgulă mobilă care are aceeași reprezentare de biți ca reprezentarea biților nesemnați a argumentului său fioat fpwr (int x) { /* Ordinul rezultat și mantisa */ nesemnat exp, sig; u nesemnat; dacă (x , ar fi capabil să determine că aproximarea n virgulă mobilă cu precizie unică are o reprezentare hexazecimală de x fdb Desigur, toate acestea sunt doar aproximări, deoarece n nu este un număr rațional Care este numărul binar fracționar notat cu această valoare în virgulă mobilă? Care este reprezentarea binară fracționată a lui y? Sugestie - vezi ex , În ce poziţie a cifrei binare (faţă de punctul binar) diverg aceste două aproximări ale lui l? Soluție de exercițiu SOLUȚIE ȘI EXERCIȚII Înțelegerea relației dintre formatele hexazecimale și binar va fi de o importanță deosebită atunci când luăm în considerare programele la nivel de mașină Metoda de implementare a acestor transformări este dată în text, dar dezvoltarea ei necesită o anumită abilitate practică x F A în binar: Hexazecimal F A Binar UN Binar în hexadecimal: Binar Hex B C xC E D în binar: Hex C E D Binar Binar în hexadecimal: Binar IT Hexazecimal B E SOLUȚIA EXERCITULUI Această problemă oferă o șansă de a ne gândi la puterile lui doi și la reprezentările lor hexazecimale Capitolul Prezentarea și lucrul cu informații și " (binar) " (hexazecimal) x x x x x x x SOLUȚIE^EXERCIȚIUL Această problemă vă oferă șansa de a încerca să convertiți între reprezentări hexazecimale și zecimale ale unor numere mici Pentru numere mari, este mult mai convenabil și mai fiabil să utilizați un calculator sau un program de conversie Decimal Binar Hexazecimal = - + OOP = - + = - + UN F - + = - + = AC - + = E - + = A - + = PLO GE • + = î Hr EXERCIȚII DE SOLUȚIE Când începeți să depanați programe la nivel de mașină, veți găsi multe cazuri în care o anumită aritmetică hexazecimală va fi utilă Este întotdeauna posibil să convertiți numere în valori zecimale, să efectuați operații aritmetice și să le convertiți înapoi, dar capacitatea de a lucra direct cu valori hexazecimale este mai eficientă și mai informativă Partea I Structura și execuția programului x s + x = x Adăugând la valoarea hexazecimală, se obține cu un carry x s - x = x ffs Scăderea a din în poziția a doua cifră necesită un împrumut de la a treia Deoarece această cifră este , este necesar și un împrumut din poziția a patra x s + = x s Valoarea zecimală ( ) este egală cu valoarea hexazecimală x x da - x c = Oh Pentru a scădea c hexazecimal (zecimal ) din hexazecimal a (zecimal ), scădeți din a doua cifră, rezultând în hexazecimal e (zecimal ) Acum, în a doua cifră, scădeți din hex c (zecimal ), rezultând în hexazecimal a (zecimal ) SOLUȚIA PENTRU EXERCIȚIUL Acest exercițiu testează înțelegerea de către elev a reprezentării octeților de date și a două moduri diferite de ordonare a octetilor Ascuțit: Contondent: Ascuțit: Contondent: Ascuțit: Contondent: Amintiți-vă că show bytes listează o serie de octeți care încep de la cel mai mic octet de adresă și trecând până la cel mai mare octet de adresă Pe o mașină înțepătoare, octeții vor fi listați de la cel mai puțin semnificativ la cel mai puțin semnificativ SOLUȚIA EXERCITULUI Acest exercițiu este o altă șansă de a exersa conversia din hexazecimal în binar De asemenea, explică complexitățile reprezentării întregi și reprezentării în virgulă mobilă Aceste probleme sunt discutate mai detaliat mai jos Folosind exemplul prezentat în text, scriem următoarele două rânduri: А С * Cu al doilea cuvânt deplasat cu două poziții față de primul, obținem o secvență de de biți de potrivire Toți biții unui număr întreg sunt încorporați într-un număr în virgulă mobilă, dincolo cu excepția bitului cel mai semnificativ, care are valoarea Acesta este cazul pentru Capitolul Prezentarea și lucrul cu informații exemplu dat în text În plus, un număr în virgulă mobilă are niște biți de ordin înalt diferit de zero care nu se potrivesc cu biții unui număr întreg SOLUȚIE ȘI EXERCIȚII Imprimarea este: Amintiți-vă că programul de bibliotecă strien nu respectă caracterul nul final, deci show bytes este imprimat doar prin caracterul F EXERCIȚII DE SOLUȚIE Această problemă este un exercițiu care vă ajută să vă familiarizați cu operațiunile booleene Rezultatul operațiunii a[ ] b[ ] -a [ ] ~b [ ] a&b[ ] a b [ ] aL b [ ] EXERCIȚII DE SOLUȚIE Această problemă ilustrează utilizarea algebrei booleene pentru a descrie și justifica sisteme de probleme reale Se poate înțelege că această algebră de culoare este identică cu cea booleană în ceea ce privește vectorii de biți cu lungimea Culorile sunt completate de complementul lui R, G și B Din aceasta putem concluziona că albul este complementul lui Negru, galbenul este complementul lui Albastru, Stacojiu este complementul lui Verde și Albastrul este complementul lui Roșu Negrul este și albul este Operațiile booleene sunt efectuate pe baza reprezentării vectorilor biți ai culorilor Obținem următoarele: Albastru ( ) I Roșu ( ) = Stacojiu ( ) Stacojiu ( ) și Albastru ( ) = Albastru ( ) Verde ( ) L Alb ( ) = Stacojiu ( ) Partea I Structura și execuția programului SOLUȚIE^EXERCIȚIUL Această procedură se bazează pe faptul că SAU EXCLUSIV este comutativ și asociativ și că i la = pentru orice valoare a lui a Capitolul descrie un caz în care codul nu funcționează corect când doi pointeri x și y sunt egali (indicând către aceeași locație) Pasul *x ★y Inițial un b Pasul aL b b Pasul aL (a L b~)L b = (b L b)L a = a Pasul (aL b)L a \u d (a l a) l b \u d b a SOLUȚIE ȘI EXERCIȚII Expresiile sunt: x | ~ xFF x L OxFF x & ~ xFF Acestea sunt expresii tipice care pot fi obținute prin efectuarea de operații pe biți la un nivel scăzut Expresia ~ xFF creează o mască în care cei biți cei mai puțin semnificativi sunt zero și toți ceilalți sunt unu Rețineți că această mască este generată indiferent de lungimea cuvântului În schimb, expresia Oxffffffoo va funcționa doar pe o mașină pe de biți SOLUȚIE^EXERCIȚIUL Aceste exerciții vă ajută să înțelegeți relația dintre operațiile booleene și operațiunile tipice de mascare Luați în considerare următorul cod: /* Set de biți */ int bis (int x, int m) { int rezultat = x | m returnează rezultatul; } /* Șterge biți */ int bic (int x, int m) { int rezultat = x & -np; returnează rezultatul; } Este ușor de observat că bis este echivalent cu OR boolean - un bit este dat în z în același mod ca și cum ar fi dat în x sau în etc Capitolul Prezentarea și lucrul cu informații Operațiunea bіc este mai subtilă Trebuie să setați bitul z la zero dacă bitul m corespunzător este unul Când completați masca cu ~t, veți dori să setați bitul z la zero dacă bitul corespunzător al măștii căptușite este zero Acest lucru se poate face folosind operația AND SOLUȚIE ȘI EXERCIȚIU I Tabelul arată corespondența dintre operațiile pe biți și expresiile logice în C Expresie Semnificat Expresie Sens X & y x X && y x X y xF X Y x ~X ~y OxFD !x !y x x & !y x X && -y x EXERCIȚII DE SOLUȚIE Expresie- ! (x L y) Adică, x L y va fi zero dacă și numai dacă fiecare bit al lui x se potrivește cu bitul corespunzător al lui y După aceea, abilitatea este cercetată! pentru a determina dacă un cuvânt conține biți diferit de zero Nu există alt motiv pentru a utiliza această expresie decât simpla scriere x == y, dar demonstrează unele dintre nuanțele operațiilor logice și la nivel de biți EXERCIȚII DE SOLUȚIE Această problemă este un exercițiu de înțelegere a diferitelor operațiuni de schimb X x " x" Boolean x " Aritmetică Shestn Binary Binary Hex Hex binar Binar șase xF [ ] [ ] x [ ] Oxs [ ] OxFC OxOF [ ] [ ] x [ ] x [ ] x Oxss [ ] [ ] x [ ] x [ ] xF x [ ] [ ] XA [ ] x [ ] x SOLUȚIA EXERCITULUI În general, lucrul cu exemple pentru lungimi de cuvinte foarte mici este o modalitate foarte bună de a înțelege aritmetica computerizată Partea I Structura și execuția programului Valorile fără semn corespund celor indicate în tabel Pentru valorile complementului a doi, valorile hexazecimale de la la au bitul cel mai semnificativ de , dând valori nenegative, în timp ce cifrele hexazecimale de la la F au bitul cel mai semnificativ de , dând o valoare negativă X B U (x) B TA(x) Şase Binar A [ ] + ' = - + ' = - [ ] '+ ° = * - ° = [ ] = - =- C [ ] + = - + = - F [ ] + + '+ ° = - + + '+ о = - SOLUȚIE ȘI EXERCIȚIU NI Pe o mașină pe de biți, orice valoare de opt cifre hexazecimale care începe cu una dintre cifrele din intervalul de la la f reprezintă un număr negativ A vedea numerele care încep cu șirul de caractere f este destul de comun, deoarece biții de început ai unui număr negativ sunt toți unul Cu toate acestea, trebuie să fii atent De exemplu, numărul x b are doar șapte cifre Introducerea zero ca bit principal dă x b , un număr pozitiv b : ec sub $ x , %esp A bd: împinge %ebx be: b mov x (%ebp), %edx B C : b d c mov Oxc (%ebp), %ebx C c : b d mov x (%ebp), %ecx D C : b fe ff ff mov xfffffe (%ebp) f %eax E - cd: cb add %ecx, %ebx cf: adăugați x (%edx), %eax F d : aO fe ff ff mov %eax, OxfffffeaO (%ebp) G - d : b ff ff ff mov OxfffffflO (%ebp) , %eax H - de: Ic mov %eax, x c (%edx) I el: d c ff ff ff mov %ebx, xffffff c (%ebp) J - e : b mov x (%edx), %eax K SOLUȚIE^EXERCIȚIUL Din punct de vedere matematic, funcțiile T U și U T sunt foarte neobișnuite Este important să înțelegeți comportamentul lor și să îl înțelegeți Capitolul Prezentarea și lucrul cu informații Această problemă este rezolvată prin reordonarea șirurilor din soluția exercițiului , în funcție de valoarea complementului a doi, apoi prin imprimarea valorii fără semn ca rezultat al funcției Pentru a specifica procesul, dăm valori hexazecimale x (șase ) (X) T P (x) - A - C - F- EXERCIȚII DE SOLUȚIE Acest exercițiu vă testează înțelegerea ecuației Pentru intrările din primele patru rânduri, valorile x sunt negative, iar T U (x) = x + Pentru celelalte două rânduri, valorile x sunt nenegative și T U (x) = x SOLUȚIE ȘI EXERCIȚII Această problemă întărește înțelegerea relației dintre reprezentarea complementului a doi și reprezentarea numerelor fără semn și impactul regulilor C al operanzilor este nesemnat, apoi celălalt operand va fi turnat la valoarea fără semn înainte de efectuarea comparației Evaluarea tipului de expresie - - == - U Nesemnat - - = ) II (( *x) = Fals Când x este (Oxffff), x*x este - (OxFFFEOOOL) x II -x >= Fals Fie x - (ТМіп ) Atunci x și -x sunt valori negative Partea I Structura și execuția programului x*y == ux*uy Adevărat Înmulțirea în complement a doi și înmulțirea fără semn se comportă la fel la nivel de biți ~x * y + uy*ux == -y Adevărat ~x este egal cu -x- uy*ux este egal cu x*y Astfel, partea stângă este echivalentă cu -x*y-y+x*y EXERCIȚII DE SOLUȚIE Înțelegerea reprezentărilor binare fracționale este un pas important către înțelegerea codificărilor în virgulă mobilă Acest exercițiu vă permite să testați mai multe exemple Valoare fracțională Reprezentare binară Reprezentare zecimală , , , , P Una dintre modalitățile simple de a lua în considerare reprezentările binare fracționale este: X xia reprezentarea unui număr ca fracție sub forma Această fracție poate fi scrisă în binar folosind reprezentarea binară a lui x, cu punctele binare setate k la dreapta Ca exemplu: pentru - avem = După ib acest punct binar este mutat cu poziții din dreapta pentru a obține EXERCIȚII DE SOLUȚIE În cele mai multe cazuri, precizia limitată a numerelor în virgulă mobilă nu reprezintă o mare problemă, deoarece eroarea relativă de calcul este încă destul de mică Cu toate acestea, în acest exemplu, sistemul sa dovedit a fi sensibil la eroarea absolută Se poate observa că x - , are următoarea reprezentare binară: □ , [ ] Capitolul Prezentarea și lucrul cu informații Când comparăm acest lucru cu reprezentarea binară, se poate observa că valoarea este " x -, adică aproximativ , x (G Yu □ , x Yu „ x YuO x bohboh Yu” , □ , x = EXERCIȚII DE SOLUȚIE O discuție detaliată a reprezentărilor în virgulă mobilă pentru lungimi mici de cuvinte ajută la clarificarea modului în care funcționează virgulă mobilă IEEE Acordați o atenție deosebită transferului dintre valorile normalizate și cele nenormalizate Cifre e E f m V GBP GBP GBP £ £ £ — — — — W-oo — — — — NaN — — — — NaN ȘI — — — — NaN Partea I Structura și execuția programului EXERCIȚII DE SOLUȚIE Valoarea hexazecimală x este echivalentă cu valoarea binară [ ] Deplasarea la dreapta cu de locuri dă , / x Îndepărtarea celui de început și adăugarea a două zerouri formează un câmp fracționar dând [ ] Ordinea se formează prin adăugarea offset-ului la , care dă (reprezentarea binară a [ ]) Această valoare este concatenată cu câmpul cu semnul pentru a obține următoarea reprezentare binară: [ ] Se poate observa că raportul dintre aceste două reprezentări corespunde celor mai puțin semnificativi biți ai întregului, până la cel mai semnificativ bit, egal cu unu, corespunzător celor cei mai semnificativi biți ai următoarei fracțiuni: ******************** А С EXERCIȚII DE SOLUȚIE Acest exercițiu vă ajută să vă gândiți la ce numere nu pot fi reprezentate exact în virgulă mobilă Acest număr are reprezentarea binară a urmat de urmat de , dând "n + Când l = , atunci valoarea este + = EXERCIȚII DE SOLUȚIE În general, este mai bine să utilizați biblioteca macro în loc să vă inventați propriul cod Cu toate acestea, acest cod funcționează pe multe mașini diferite Să presupunem că valoarea e depășește la infinit l#definiți POS INFINITY e #define NEG INFINITY (-POS INFINITY) #define NEG ZERO (- /POS INFINITY) EXERCIȚII REZOLVATE ȘI E Astfel de exerciții ajută la dezvoltarea capacității de a justifica operațiunile cu virgulă mobilă din punctul de vedere al unui programator Asigurați-vă că fiecare răspuns este de înțeles x = (int) (float) x Nu De exemplu, când x - Tmax Capitolul Prezentarea și lucrul cu informații x == (int) (dublu) x Da, pentru că double are mai multă precizie și rază decât int f = (fioat) (dublu) f Da, pentru că dublu are mai multă precizie și rază de acțiune decât fioat d == (fioat) d Nu De exemplu, când d este egal cu e , obținem +oo în partea dreaptă f == - (-f) Da, un număr în virgulă mobilă este anulat printr-o simplă inversare a semnului , / == / , Nu, valoarea din partea stângă va fi valoarea întreagă , în timp ce valoarea din partea dreaptă va fi o aproximare în virgulă mobilă a | (d >= , ) II ((d* ) gcc - -op pl c p c Comanda gcc necesită utilizarea compilatorului GNU C GCC Deoarece acesta este compilatorul implicit pe Linux, îl putem invoca prin simpla specificare a cc Comutatorul - necesită compilatorului să aplice optimizarea pe două niveluri În general, creșterea nivelului de optimizare crește viteza de execuție a programului, dar cu prețul creșterii timpului de compilare și a posibilelor dificultăți la utilizarea instrumentelor de depanare Al doilea nivel de optimizare poate fi văzut ca un compromis rezonabil între performanța optimă și ușurința în utilizare Tot codul din această carte a fost compilat folosind acest nivel de optimizare Această comandă invocă de fapt o serie de programe care transformă codul sursă într-un program de lucru În primul rând, preprocesorul C extinde codul sursă astfel încât să includă toate fișierele specificate în comanda #include și să conțină extensiile tuturor macrocomenzilor utilizate Compilatorul generează apoi versiuni de cod de asamblare ale celor două fișiere sursă numite pi s și p s Mai mult, asamblatorul (asamblerul) convertește codul de asamblare în fișiere binare ale codurilor obiect pi o și p o Și, nako Partea I Structura și execuția programului În cele din urmă, linkerul îmbină aceste două fișiere obiect cu coduri care implementează funcții standard din biblioteca Unix (de exemplu, funcția printf) și generează codul executabil în forma sa finală Editarea linkurilor este tratată mai detaliat în Capitolul Cod la nivel de mașină Compilatorul face aproape toată munca procesului general de compilare prin conversia programelor reprezentate de modelul de execuție C în instrucțiuni elementare pe care le execută procesorul Caracteristica principală a acestui model este că este prezentat într-un format mai lizibil în comparație cu formatul binar al codului obiect Înțelegerea codului de asamblare și relația acestuia cu codul sursă este un pas cheie în înțelegerea modului în care computerele rulează programe Percepția unei mașini de către un programator în limbaj de asamblare diferă semnificativ de cea a unui programator C El vede astfel de stări de procesor care sunt ascunse de un programator C: □ Contorul programului (denumit %eip) indică adresa de memorie a următoarei instrucțiuni de executat □ Un fișier registru întreg conține opt celule denumite care stochează valori pe de biți Aceste registre pot conține adrese (corespunzătoare indicatorilor limbajului C) sau date întregi Unele registre sunt folosite pentru a ține evidența celor mai importante părți ale stării unui program, în timp ce altele sunt folosite pentru a stoca date intermediare, cum ar fi variabilele locale ale procedurii □ Registrele codurilor de condiție conțin informații despre cele mai recente instrucțiuni aritmetice executate Aceste registre sunt folosite pentru a implementa modificări condiționate ale logicii de control a programelor care sunt necesare, de exemplu, la implementarea instrucțiunilor if sau while A Fișierul registrului de date în virgulă mobilă este format din opt celule dedicate stocării datelor corespunzătoare În timp ce limbajul C oferă un model ale cărui obiecte, reprezentate prin diferite tipuri de date, pot fi declarate și plasate în memorie, codul de asamblare tratează memoria ca pe o matrice mare adresată de octeți Tipurile de date agregate în C, cum ar fi matrice și structuri, sunt reprezentate în codul de asamblare ca colecții contigue de octeți Chiar și pentru tipurile de date scalare, codul de asamblare nu face distincție între numere întregi semnate și nesemnate, între diferite tipuri de pointeri și chiar între pointeri și numere întregi Memoria programului conține codurile obiect ale programului, unele informații necesare sistemului de operare, stiva programului executabil folosit pentru a gestiona apelurile și returnările de proceduri și blocurile de memorie pe care utilizatorul le alocă (de exemplu, folosind procedura bibliotecii malloc) Capitolul Reprezentarea programelor la nivel de mașină Memoria programului este adresată folosind adrese virtuale În orice moment, pot fi considerate valide numai subgami limitate de adrese virtuale De exemplu, în timp ce adresele pe de biți pot acoperi o gamă de valori de adrese de GB, un program tipic are acces la doar câțiva megaocteți Acest spațiu de adrese virtuale este gestionat de sistemul de operare, care traduce adresele virtuale în adrese fizice cu valori în memoria actuală a procesorului O instrucțiune a mașinii poate efectua doar o operație foarte simplă De exemplu, poate adăuga două numere în registre, poate transfera date între memorie și un registru sau poate sări condiționat la adresa unei noi instrucțiuni Sarcina compilatorului este de a genera secvențe de instrucțiuni care implementează astfel de constructe de programare precum evaluarea valorilor expresiilor aritmetice, buclelor sau apelurilor și returnărilor de proceduri Exemple de coduri Să ne imaginăm că scriem în C și punem definiția următoarei proceduri (Listing ) în fișierul code c: J Listarea Definiţia procedurii J \ , , / ,\ h J int acum = ; int suma(int x, int y) { int t = x + y; acum += t; întoarcere t; opt } Pentru a vedea codul de asamblare compilat de compilatorul C, putem folosi comutatorul -s de pe linia de comandă: unix> gcc - -S cod c Cu această comandă, compilatorul generează codul de asamblare code c, dar nu face altceva (Într-o situație normală, apoi cheamă asamblatorul pentru a construi fișierul de cod obiect ) Compilatorul GCC generează cod de asamblare într-un format nativ numit GAS (prescurtare de la Gnu ASsembler) Vom folosi acest format ca bază pentru reprezentarea pe care o folosim, care diferă semnificativ de formatul folosit pentru documentația Intel și compilatoarele Microsoft Notele bibliografice conțin informații despre locația documentației pe diferite formate de cod de asamblare Dosarul de asamblare conține diverse declarații, inclusiv următoarele rânduri (Listing ): Partea I Structura și execuția programului i Lista Procedura de asamblare f ' gcc - -c cod c Acest program generează un fișier de cod obiect, code o, care este în format binar și, prin urmare, nu poate fi vizualizat direct Fișierul code o de de octeți are încorporată o secvență de octeți care are următoarea reprezentare hexazecimală: e b Os eu d c Această secvență este codul obiect corespunzător instrucțiunilor de asamblare de mai sus Principala lecție pe care trebuie să o învățăm în această situație este că programul pe care mașina îl execută de fapt este pur și simplu o secvență de octeți care codifică setul adecvat de instrucțiuni Aparatul primește foarte puține informații despre codul sursă din care au fost construite aceste instrucțiuni Cum să găsiți reprezentarea în octeți a unui program Am folosit mai întâi asamblatorul invers (care va fi descris pe scurt mai târziu) pentru a determina că suma codului programului conține octeți În continuare, vom aplica instrumentul de depanare GNU GDB la fișierul de cod cu și da-i o poruncă (gdb) suma x/ xb verificați (abrevierea x) octeți (abrevierea b) în format hexazecimal (abrevierea x din nou) Veți descoperi în curând că instrumentul GDB are multe caracteristici care sunt utile în analizarea programelor la nivel de mașină, așa cum se discută în Sec Capitolul Reprezentarea programelor la nivel de mașină Un instrument indispensabil pentru examinarea fișierelor cu coduri obiect este o clasă de programe numite dezasamblare Aceste programe bazate pe cod obiect generează un format similar cu codul de asamblare Pe sistemele Linux, această sarcină este rezolvată de programul objdump (prescurtare pentru object dump - object program dump), dacă specificați comanda corespunzătoare cu steag-ul -d din linia de comandă: unix> objdump -d code o Rezultatul (tocmai am adăugat numerotarea rândului în stânga și un comentariu în dreapta) arată ca Lista : Lista Procedura de reasamblare Asamblarea inversă a funcției de sumă în fișierul code o : Offset Bytes Echivalent limbaj de asamblare : împinge %ebp : e mov %esp,%ebp : b c mov Oxc(%ebp), %eax : adăugați x (%ebp), %eax : adăugați %eax, x f: eu mov %ebp,%esp : d POP %ebp : sz ret : por În stânga, vedem valori hexazecimale, reprezentate ca o secvență de octeți, împărțite în grupuri care conțin de la la octeți fiecare Fiecare dintre aceste grupuri este o instrucțiune separată al cărei echivalent în limbaj de asamblare este afișat în dreapta Trebuie remarcate mai multe proprietăți: □ Comenzile arhitecturii IA pot varia în lungime și pot conține de la la octeți Codarea instrucțiunilor este concepută astfel încât instrucțiunile utilizate frecvent și instrucțiunile cu un număr mic de operanzi necesită mai puțini octeți decât instrucțiunile utilizate rar sau instrucțiunile cu un număr mare de operanzi □ Formatul comenzii este ales în așa fel încât dintr-o anumită poziție de pornire octeții corespunzători să fie decodați fără ambiguitate în comenzi de mașină De exemplu, numai comanda pushi %ebp începe cu o valoare de octet de □ Asamblatorul invers definește codul de asamblare bazat exclusiv pe secvențe de octeți dintr-un fișier obiect Nu necesită acces la codurile sursă sau la versiunea de asamblare a programului □ Asamblatorul invers utilizează convenții de denumire a instrucțiunilor ușor diferite față de cele utilizate de formatul de gaz În acest exemplu, omite sufix în multe dintre comenzi Partea I Structura și execuția programului □ Vedem asta în comparație cu codul de asamblare din cod s, la sfârșitul secvenței este comanda por Această comandă nu va fi niciodată executată (urmează comanda de returnare din procedură) și, dacă ar fi executată, nu ar avea niciun efect asupra cursului ulterioar al evenimentelor (de unde și numele, care înseamnă "prin operație" - fără operații, vorbire colocvială sună ca „po op”) Compilatorul inserează această instrucțiune ca una dintre modalitățile de a rezerva spațiu de memorie suplimentar pentru procedură Construirea programului de lucru real necesită rularea linker-ului pe un set de fișiere de cod obiect, dintre care unul trebuie să conțină funcția principală Să presupunem că avem următoarea funcție în fișierul form c (Listing ): int main() { sumă retur ( , ); } Într-un astfel de caz, putem construi un program de lucru după cum urmează: unix> gcc - -o cod prog o shaip c Fișierul prog a crescut la de octeți, deoarece conține nu numai codul pentru celelalte două rutine, ci și informații utilizate pentru a porni și opri programul, precum și pentru a interacționa cu sistemul de operare De asemenea, putem asambla invers fișierul prog: unix> objdump -d prog Asamblatorul invers generează diverse secvențe de cod, inclusiv următoarele (Listing ): Asamblarea inversă a funcției de sumă în fișierul prog b : b : push %ebp b : e mov %esp,%ebp b : b Oc mov Oxc(%ebp),%eax ba: adăugați x (%ebp), %eax bd: -b adăugați %eax, x s : es mov %ebp,%esp c : d pop %ebp c : c ret c : pori Capitolul Reprezentarea programelor la nivel de mașină Vă rugăm să rețineți că acest cod este aproape identic cu codul obținut ca urmare a asamblarii inverse a fișierului code c Una dintre principalele diferențe este că adresele enumerate în coloana din stânga, altele - linkerul a schimbat locația acestui cod, determinând modificarea adreselor comenzilor A doua diferență este că linkerul a decis în sfârșit unde să stocheze variabila globală de acumulare Linia din codul de asamblare inversă pentru fișierul code o (vezi Lista - ) specifică adresa zero a variabilei accum În codul de asamblare inversă (vezi Lista ), adresa acestei variabile este x Acest lucru poate fi văzut din afișarea instrucțiunii corespunzătoare din codul de asamblare Acest lucru este evident și din ultimii patru octeți ai comenzii, care sunt prezentați în ordine de la cel mai puțin semnificativ la cel mai semnificativ ca Nota de formatare Când citiți codul de asamblare construit de compilatorul GCC, există unele dificultăți Conține anumite informații care nu ne interesează Pe de altă parte, nu conține nicio informație care ar putea servi drept descriere a programului sau a modului în care funcționează De exemplu, să presupunem că fișierul simple c conține următorul cod (Listing ): gaz* I'li^tingdb Exemplu de cod - yu/~v int simplu (int *xp, int y) { int t = *xp + y; *xp = t; întoarcere t; } Compilatorul GCC invocat cu opțiunea -s generează următorul fișier pentru simple c (Listing ): fișier „simplu, cu” versiunea „ ” gcc compiled : , text/ aliniază globisimple type simplu,@funcție simplă: pushl %ebp Partea I Structura și execuția programului movl %esp,%ebp movl (%ebp),%eax movl(%eax),%edx addl (%ebp),%edx movl %edx,(%eax) movl %edx,%eax movl %ebp,%esp popi ret %ebp lfel: mărime simplă, Lfel-simplu ident „GCC: (GNU) (lansare)” Acest fișier conține mai multe informații decât avem nevoie de fapt Toate liniile care încep cu un punct sunt directive care controlează modul în care funcționează asamblatorul sau linkerul De regulă, le vom ignora Pe de altă parte, nu există comentarii explicative despre ceea ce fac anumite comenzi și cum se leagă ele cu codul sursă Pentru a face codul de asamblare mai ușor de înțeles, îl vom prezenta într-o formă care prevede numerotarea liniilor și permite explicații de diferite tipuri În exemplul nostru, versiunea adnotată a codului devine Lista : g g rv n î Lista & Exemplu de cod cu explicații D - * ? v j simplu: pushl %ebp Salvează indicatorul de cadru movl %esp,%ebp Setați un nou indicator de cadru movl (%ebp),%eax Obțineți xp movl (%eax),%edx Extras *xp addl (%ebp),%edx Adăugați y pentru a obține t movl %edx,(%eax) Stocați t la *xp movl %edx,%eax Setați t ca valoare de returnare movl %ebp,%esp Resetează indicatorul stivei popi %ebp Resetează indicatorul de cadru ret Întoarce rezultatul În cazuri normale, vom afișa numai acele linii de cod care sunt relevante pentru problemele în discuție Fiecare linie este numerotată în stânga pentru ușurință de referință, iar în dreapta sunt scurte explicații ale rezultatelor comenzii și modul în care comanda se raportează la calculele implementate de codul sursă C limbajul de asamblare, își prezintă programele Capitolul Reprezentarea programelor la nivel de mașină Formate de date Datorită originii sale ca arhitectură pe biți și apoi extinsă într-o arhitectură pe de biți, Intel folosește termenul „cuvânt” pentru a se referi la un tip de date pe biți Acesta este motivul pentru care numerele pe de biți sunt uneori menționate ca „cuvânt dublu” Multe dintre comenzile pe care le vom întâlni operează pe octeți sau cuvinte duble În tabel Figura prezintă reprezentările mașinii utilizate pentru tipurile de date simple C Rețineți că cele mai comune tipuri de date sunt stocate ca cuvinte duble Acest lucru se aplică atât tipului int obișnuit, cât și tipului int lung, atât semnat cât și nesemnat În plus, toate indicatoarele (marcate cu un asterisc în tabel) sunt stocate ca cuvinte de octeți De obicei, octeții sunt utilizați în cazul manipulării datelor șir Numerele cu virgulă mobilă vin în trei formate: valori cu precizie unică ( octeți) corespunzătoare tipului C float, valori cu precizie dublă ( octeți) corespunzătoare tipului dublu C și valori lungi de precizie dublă ( octeți) Compilatorul GCC folosește tipul de date dublu lung pentru referințe la valori în virgulă mobilă de înaltă precizie De asemenea, le stochează ca valori de octeți pentru a îmbunătăți performanța memoriei, așa cum vom vedea mai jos Deși standardul ANCI C tratează long double ca un tip de date, datele de acest tip sunt implementate pentru majoritatea combinațiilor compilator/mașină folosind același format de octeți ca tipul dublu obișnuit Suportul de înaltă precizie este disponibil numai cu combinația dintre compilatorul GCC și arhitectura IA Tabelul Dimensiunile tipurilor de date standard Descriere în C Tip de date Intel Sufix GAS Dimensiune (în octeți) char Byte b Cuvânt scurt W int Cuvânt dublu nesemnat Cuvânt dublu long int Cuvânt dublu nesemnat lung Cuvânt dublu char * Cuvânt dublu float Precizie unică t dublu Precizie dublă lung dublu Precizie crescută t / După cum arată tabelul, fiecare operație gac are un sufix de un singur caracter care indică dimensiunea operandului De exemplu, comanda (trimite date) Partea I Structura și execuția programului poate fi reprezentat în trei versiuni: moveb (trimite un octet), movew (trimite un cuvânt) și movel (trimite un cuvânt dublu) Sufixul este folosit pentru cuvinte duble, deoarece pe multe mașini valorile pe de biți sunt numite „cuvinte duble”, o relicvă a unei epoci în care dimensiunile cuvintelor de biți erau standard Rețineți că sufix este folosit pentru a desemna atât numere întregi de octeți, cât și numere cu virgulă mobilă cu precizie dublă de octeți Cu toate acestea, nu apare nicio ambiguitate, deoarece virgulă mobilă necesită utilizarea unui set complet diferit de instrucțiuni și registre Acces la date Arhitectura Unității Centrale de Procesare (CPU - Central Processing Unit) A conține un set de opt registre concepute pentru a stoca valori pe de biți Aceste registre sunt folosite pentru a stoca date întregi, precum și indicatori Pe fig este o diagramă a acestor opt registre Toate numele de registru încep cu %e, dar în rest sunt nume distincte În originalul , registrele aveau o lungime de biți și fiecare avea propriul său scop Odată cu trecerea la adresa directă, nevoia de registre specializate a scăzut semnificativ În cea mai mare parte, primele șase registre pot fi considerate registre de uz general și nu există restricții privind utilizarea lor Spunem „mai ales” pentru că unele instrucțiuni folosesc registre fixe ca registre sursă și destinație De asemenea, în diferite proceduri, convențiile pentru salvarea și restaurarea primelor trei registre (%eax, %esi și %edi) diferă de cele pentru următoarele trei registre (%ebx, %edi și %esi) Vom analiza această problemă în Sect Celelalte două registre (%ebp și %esp) conțin indicii către locuri importante din stiva de programe Conținutul acestora poate fi modificat numai în conformitate cu sistemul de convenții standard privind managementul stivei Din fig rezultă că informațiile din cei doi octeți inferiori ai primilor patru registre pot fi citite și scrise separat, folosind operații octet cu octet Această caracteristică a fost introdusă în pentru a oferi compatibilitate inversă cu și , două microprocesoare pe biți care datează din Când o instrucțiune de octet actualizează conținutul unuia dintre aceste „elemente de registru” de un octet, ceilalți trei octeți ai registrului nu își schimbă valoarea În mod similar, cei biți cei mai puțin semnificativi ai fiecărui registru pot fi citiți și modificați folosind operații cu cuvinte Această proprietate provine de la microprocesoarele pe biți din care provine arhitectura IA Specificatori de operanzi Majoritatea instrucțiunilor iau unul sau mai mulți operanzi (operanzi) care descriu valorile originale la care se face referire atunci când sunt executate Capitolul Reprezentarea programelor la nivel de mașină O cincisprezece Leah v ' %ah %al %ch %C %edx? ''- f~%dxr \ %dh %dl Lex' ? %bx %bh %bl %eș£ ,%sXr %edl %di %esp %sp indicator de stivă %bp indicatorul de cadru Orez Registre întregi operația corespunzătoare și destinația în care este scris rezultatul Arhitectura IA acceptă mai multe formate de declarații (Tabelul ) Valorile inițiale pot fi reprezentate ca constante sau pot fi citite din registre sau din memorie Rezultatele pot fi plasate într-un registru sau în memorie Prin urmare, tipurile posibile de operanzi pot fi reprezentate prin trei categorii Primul tip, operanzii imediati, reprezintă constante În formatul gaz, astfel de operanzi încep cu un „$” urmat de un număr întreg în notația standard C, cum ar fi $- sau $ xie Orice valoare care este reprezentată de un cuvânt de de biți poate/utiliza, deși asamblatorul va folosi coduri de unul sau doi octeți acolo unde este posibil Al doilea tip, registru (registru), înseamnă conținutul unuia dintre registre sau elementele unuia dintre cele opt registre de de biți (de exemplu, %eax), utilizate atunci când se efectuează o operație cu două cuvinte, sau unul dintre cele opt elemente de registru de un octet (de exemplu, %a ) pentru operațiile pe octeți În tabel folosim notația Ea pentru a desemna un registru arbitrar a, iar valoarea acestuia este notată cu R[Ea], considerând mulțimea de registre ca un tablou R indexat prin identificatori de registru Al treilea tip de operand este o referire la o celulă de memorie (referință de memorie), care dă acces la o celulă de memorie, a cărei adresă este obținută ca urmare a calculelor corespunzătoare Această adresă este adesea denumită adresa efectivă Deoarece considerăm memoria ca o matrice mare de octeți, noi Partea I Structura și execuția programului considerați denumirea Mb[Addr\ ca referință la valoarea ^-octet stocată în memorie, începând cu adresa Adr Pentru a simplifica prezentarea, vom omite indicele b Ca Tabel , există diverse moduri de adresare, astfel încât sunt posibile mai multe forme de referință la locațiile de memorie Forma cea mai generală este afișată în rândurile de jos ale tabelului, care afișează sintaxa Imm(Eb, Ei, s) O astfel de referință constă din patru componente: deplasarea imediată Іт, registrul index al registrului de bază Еі și factorul de scară , în timp ce s poate lua valorile , , și Adresa de execuție este calculată prin formula Іт + R[ eJ + R[£j ] x s Această formă generală este întâlnită atunci când se face referire la elemente de matrice Toate celelalte forme sunt pur și simplu cazuri speciale ale acestei forme generale în care anumite componente sunt omise După cum vom vedea mai târziu, formele mai complexe de adresare sunt utile atunci când ne referim la elemente de matrice și structuri Tabelul Forme de operand Tip Form Valoare operand Nume Direct $Itt Itt Imediat Înregistrați Ea R[£J Register Memorie IT M[/TI I] Absolută Memorie (Ea) M[R[EJ] Indirect Memorie Imm(Eh) M[ta] + R[£/>]] Bază + offset Memorie (Eh, £,) M[R[E ]] + R[E,]] Indexat Memorie lmr^(Eh, E,) M[Imm + R[Eh]] + R[E,]] Indexat Memorie (,Ei>S) M[R[E,]s] Normalizat indexat Memorie Imm(, Eh s) M[Imm + R[£,] •$] Normalizat indexat Memorie (Eb, Eh s) M[R[EJ + R[E,] s] Normalizat indexat Memorie Imm(Eh, Eh s) M[Imm + R[EJ + R[£,]s] Normalizat indexat Operanzii pot desemna valori directe (constante), valori de registru și valori stocate în memorie Factorul de scară poate fi , , sau Capitolul Reprezentarea programelor la nivel de mașină EXERCIȚIUL Să presupunem că următoarele valori sunt stocate în memorie la adresele specificate și în registre: Semnificația adresei x xFF x ohav x x OxIOS x Înregistrare Sensul %ex x %ex x %edx x Completați următorul tabel arătând valorile operanzilor specificați: Semnificația operandului %eax x x USD (%eax) (%ex) (%eax,%edx) (%ex,%edx) OxFC(,%ex, ) (%eax,%edx, ) Comenzi de mișcare a datelor Printre cele mai frecvent utilizate comenzi sunt cele care mută date Versatilitatea notației operandului permite instrucțiunilor simple de mișcare a datelor pentru a realiza ceea ce, pe multe mașini, ar necesita o secvență de instrucțiuni multiple În tabel este o listă cu cele mai importante comenzi de mișcare a datelor Comanda show este folosită cel mai frecvent pentru a muta cuvinte duble Operandul sursă reprezintă o valoare care este o valoare imediată, fie stocată într-un registru, fie în memorie Operandul de destinație înseamnă o locație de memorie, care este fie un registru, fie o adresă de memorie Arhitectura introduce o restricție conform căreia ambii operanzi nu pot fi referințe la locații de memorie în același timp Copierea unei valori dintr-o locație de memorie în alta necesită două instrucțiuni: prima instrucțiune încarcă valoarea într-un registru, iar a doua instrucțiune încarcă acea valoare a registrului în locația de destinație Partea I Structura și execuția programului Tabelul Comenzi de mișcare a datelor Descrierea rezultatului comenzii movl S,D £>"- S Mută dword movw S,D D *-£)+! Creșteți cu deci DD ) setge D setnl D = semn) setg D setnge D ) setae D setnb D =) setb D setnae D În orice caz, semnul semn capătă valoarea opusă diferenței adevărate Prin urmare, operația EXCLUSIVE-OR (SAU exclusiv) a biților de overflow și a biților de semn necesită verificarea condiției a ) jge Etichetă jnl ~ (SFAOF) Mai mare sau egal cu (>= semn) jl Etichetă jnge SFAOF Mai puțin de (semnul ) jae Etichetă jnb - CF Mai mare decât sau egal (fără semn >=) jb Etichetă jnae CF Mai jos (fără semn , mergeți la destl • L : dest : movl %edx,%eax Rețineți că linia conține o directivă către asamblator, conform căreia următoarea instrucțiune trebuie să înceapă la o adresă care este un multiplu de , lăsând cel puțin octeți neutilizați Această directivă este folosită pentru ca procesorul să poată utiliza în mod optim memoria cache pentru stocarea temporară a instrucțiunilor Versiunea construită de asamblator a formatului o, după ce a fost procesată de către asamblator invers, ia următoarea formă (Listarea - ): ^ Lista Prelucrare asamblare * * L/ £ • ? \v : e jle b Adresă de salt = deșt a: d b lea x (%esi),%esi Adăugate comenzi nops : d mov %edx,%eax destl: : cl f sar $ x ,%eax : c sub %eax,%edx : d test %edx,%edx : f f jg Adresa filialei = destl b: dO mov %edx,%eax dest : Comanda iea x (%esi),%esi de pe linia nu face nimic Este folosit ca o comandă de octeți, astfel încât următoarea comandă (linia ) să aibă o adresă de pornire care este un multiplu de Capitolul Reprezentarea programelor la nivel de mașină În comentariu, care lasă asamblatorul invers în dreapta, adresele de ramificație sunt date direct ca xii pentru instrucțiunea și ca pentru instrucțiunea Cu toate acestea, la analizarea reprezentării în octet a instrucțiunilor, observăm că adresa săriturii în instrucțiunea este reprezentată (în al doilea octet) ca oxii (zecimală ) Adăugând această adresă cu Oxa (zecimală ) reprezentând adresa instrucțiunii următoare, obținem adresa de salt Oxii (zecimală ), adică adresa instrucțiunii În mod similar, adresa de instrucțiuni de salt este reprezentată ca xf (zecimal ) de către octetul de complement Adăugarea acestei valori la oxi (zecimală ), adică adresa de instrucțiune , dă oxi (zecimală ), adresa de instrucțiune După cum arată aceste exemple, valoarea contorului programului în adresare relativă este adresa instrucțiunii care urmează instrucțiunii de salt, dar nu instrucțiunii de salt în sine Această convenție datează din zilele în care procesorul a actualizat contorul programului ca prim pas în executarea unei anumite instrucțiuni Lista - arată versiunea de asamblare inversă a programului după ce legătura a fost editată - • c : e jle db ca: d b lea x (%esi),%esi d : dO mov %edx,%eax d : cl f sar $ x ,%eax d : c sub %eax,%edx d : d test %edx,%edx d : f f jg d db: dO mov %edx,%eax la adrese diferite, dar codurile Comenzile afișate aici au fost mutate adresele de salt din rândurile și rămân neschimbate Utilizarea adresării relative a ramurilor de către contorul de program vă permite să obțineți coduri de instrucțiuni compacte (care necesită doar doi octeți), iar codul obiect poate fi mutat în memorie în diferite poziții fără modificare EXERCIȚIUL la următoarele întrebări referitoare la În următoarele fragmente de cod binar generate de asamblatorul invers, unele dintre date sunt înlocuite cu x Răspunde la comenzile de salt: Care este scopul comenzii jmp? dlc: dle: da eb jbe jmp XXXXXXX d Care este adresa comenzii mov? XXXXXX: XXXXXX: eb c f jmp mov d $ x , xffffff (%ebp) Partea I Structura și execuția programului În următorul cod de program, adresa de salt este reprezentată în adresare relativă prin contor de program în cod de octeți Octeții sunt ordonați de la cel mai puțin semnificativ la cel mai semnificativ, reflectând ordonarea octeților adoptată de arhitectura IA Care este adresa de salt? : e cb jmp XXXXXXX : pori Explicați relația dintre comentariul din dreapta și codificarea octetilor din stânga Ambele linii fac parte din codul de comandă jmp f : ff e a jmp * x a e : Pentru a implementa constructele de control ale limbajului C, compilatorul trebuie să folosească diferitele tipuri de instrucțiuni de salt pe care tocmai le-am uitat În continuare, ne vom uita la cele mai comune constructe, începând cu salturi condiționale simple, apoi ne vom uita la instrucțiunile buclei și instrucțiunile select Traducere salturi condiționate Instrucțiunile condiționate în C sunt implementate folosind diferite combinații de salturi condiționate și necondiționate De exemplu, Lista arată codul pentru o funcție C care calculează valoarea absolută a diferenței dintre două numere Compilatorul GCC generează codul limbajului de asamblare prezentat în Lista - Am construit o versiune a acestei funcții numită gotodiff (Listarea - ) care urmează mai îndeaproape logica de control a acestui program în limbaj de asamblare Utilizează instrucțiunea C goto, care este aproape la fel cu un salt necondiționat în limbajul de asamblare Instrucțiunea goto less de pe linia provoacă un salt la eticheta less de pe linia , sărind peste instrucțiunea plasată pe linia Rețineți că este proastă utilizarea instrucțiunilor goto în programare, deoarece poate face programul dificil de citit și de depanat Îl folosim în versiunile noastre ca o modalitate de a crea programe C care descriu logica de control a programelor în limbaj de asamblare Vom numi astfel de programe C „goto programs” int absdiff(int x, int y) { dacă (x ) *p += a; cinci } apoi compilatorul generează următoarele coduri în limbaj de asamblare: movl (%ebp),%edx movl (%ebp), %eax testl %eax,%eax je L testel %edx,%edx jle L addl %edx,(%eax) L : Scrieți o versiune C a comenzii goto care efectuează aceleași calcule și reproduce logica de control a programului în codul de asamblare în stilul prezentat în Lista - S-ar putea să vă fie util să furnizați acestui cod comentarii similare cu cele pe care le-am făcut în exemplele noastre Capitolul Reprezentarea programelor la nivel de mașină Explicați de ce codurile limbajului de asamblare conțin două sărituri condiționate, chiar dacă codurile C conțin doar o declarație if Cicluri Limbajul C oferă utilizatorilor mai multe construcții de buclă, și anume while, for și do-while Nu există constructe corespunzătoare în limbajul de asamblare În schimb, sunt folosite diverse combinații de teste de condiții și tranziții pentru a oferi un efect de buclă Este interesant de observat că majoritatea codurilor de buclă sunt generate din tipul de buclă do-while, chiar dacă acest tip de buclă este destul de rar în programele reale Alte bucle sunt convertite în forma do-while și apoi compilate în cod nativ Vom studia transformarea buclelor, considerându-le ca o secvență, începând cu o buclă do-while și apoi trecând la bucle mai complexe cu implementare mai complexă bucle do-while Forma generală a unei bucle do-while este următoarea: do organism-onepamop în timp ce (expr-test)\ Scopul buclei este de a executa în mod repetat body-onepamop (corpul buclei), de a evalua text-expr (condiția pentru continuarea buclei) și de a continua bucla dacă rezultatul calculului nu este zero Rețineți că corpul buclei este executat cel puțin o dată De obicei, o implementare a buclei are următoarea formă generală: Ioor: organism-onepamop t = expr-test\ daca(t) goto-loop; De exemplu, Lista - arată o implementare standard de program pentru calcularea elementului / al unei secvențe Fibonacci folosind o buclă do-while Această secvență este definită de următoarea relație de recurență: F, =l F =l F„ = F„-i + Fn- , n> Partea I Structura și execuția programului De exemplu, primele zece elemente ale secvenței sunt numerele , , , , , , , și Pentru a obține această secvență într-o buclă, începem calculul ei cu Fo = și F \ = , și nu cu F} și Г = int fib dw(int n) { int i = ; int val = ; intnval = ; face { int t = val + nval val = nval; nval = t; i++; } în timp ce (i ) & (y = Aceasta salvează o instrucțiune a codului limbajului de asamblare pL esting Calcul folosind cyclel en) am terminat; nmi = nl; bucle: t = val+nval; val = nval; nval = t; nmi-; dacă (nmi) goto-loop; optsprezece gata: valoare returnată; } Tabelul Utilizarea carcasei Valoarea inițială a variabilei de înregistrare %edx nmi n- %ebx val %ecx nval movl (%ebp),%eax Luați n movl $l,%ebx Setați val la movl $ ,%ecx Setați nval la cmpl %eax,%ebx Compara val:n jge L Dacă >= du-te la terminat leal - (%eax), %edxnmi = n- L :buclă: leal (%ecx,%ebx),%eax Compara t = nval+val movl %ecx,%ebx Set val la nval ovl %eax,%ecx Setați nval la t Capitolul , Reprezentarea programelor la nivel de mașină deci %edx jnz L ,L : Decrementați nmi dacă != , mergeți la bucla terminată: EXERCIȚIUL Pentru programul C prezentat aici int loop while(int a, int b) { int i = ; int rezultat = a; în timp ce (i ) goto loc def; /* Următoarea instrucțiune goto nu este permisă în C */ goto jt[xi]; IOC-A: /* Cazul */ rezultat *= ; am terminat; IOC-B: /* Cazul */ rezultat += ; /* Fail to another case */ loc C: /* Case */ result += ; am terminat; loc D: /* Cazurile , */ rezultat *= rezultat; am terminat; loc def: /* Casă implicită */ rezultat = ; terminat: returnează rezultatul; } Lista - prezintă programul în limbaj de asamblare care rezultă din compilarea procedurii switch eg Comportamentul unui astfel de cod de program este afișat în limbajul C extins folosind exemplul comutatorului, de exemplu procedura impi prezentată în Listen Capitolul Reprezentarea programelor la nivel de mașină ge Spunem „extins” deoarece C obișnuit îi lipsesc constructele necesare pentru a suporta acest tip de tabel de salt, ceea ce înseamnă că codul pe care îl folosim este invalid Matricea jt conține intrări, fiecare dintre ele fiind adresa blocului de program corespunzător În acest scop, extindem limbajul C adăugând date de tip cod Liniile - stabilesc accesul la masa de sărituri Pentru a vă asigura că valorile lui x care sunt fie mai mici de , fie mai mari de invocă calculele specificate de cazul implicit, programul generează o valoare xi fără semn egală cu x-io Pentru valorile lui x între și , xi ia valori între și Toate celelalte valori vor fi mai mari decât , deoarece în acest caz valorile negative ale x- sunt tratate de computer ca fiind numere nesemnate de o magnitudine foarte mare Din cauza acestei circumstanțe, programul folosește comanda ja (mai mare pentru numerele fără semn) pentru a sări la codul care este cazul implicit când xi este mai mare de Folosind comanda jt, care este folosită ca indicator de tabel de salt, acest program codul sare la adresa specificată în intrarea xi din acest tabel Rețineți că această formă a comenzii goto nu este permisă în C Comanda de pe linia sare la intrarea corespunzătoare din tabelul de salt Deoarece această tranziție este indirectă, ținta este în memorie Adresa executabilă a comenzii de citire este determinată prin adăugarea adresei de bază descrise de eticheta B și a valorii scalate a variabilei (această valoare, care este stocată în registrul %eax, este înmulțită cu deoarece fiecare intrare din tabelul de salt este lungime de octeți) I Lista operator asamblator select \ ' d- i; Accesați tabelul de sărituri leal - (%edx),%eax Calculul expresiei хі = х- cmpl $ ,%ex Comparație хі: ja L dacă >, du-te la loc def jmp * L (,%eax, ) Treci la jt[xi] Cazul ,L : loC-A: leal (%edx,%edx, ),%eax Evaluarea expresiei *x leal (%edx,%eax, ),%edx Evaluarea expresiei x+ * *x jmp L Goto done Cazul L : loc B: addl $ ,%edx result += , Fail to the next case Cazul L : oc C: addl $ll,%edx rezultat += jmp L Goto done Partea I Structura și execuția programului Cazurile , L : loc D: imull %edx,%edx result *= rezultat jmp L Goto done Cazul implicit L : loc def: xorl %edx,%edx rezultat = Întoarcerea unui rezultat L : movl %edx,%eax Terminat: Setați rezultatul ca valoare de returnare În codul limbajului de asamblare, tabelul de salt este reprezentat de următoarele declarații din Lista - , pe care le-am comentat: sectiunea rodata aliniați Aliniați adresele cu un multiplu de L : lung L Cazul : oc A lung L Caz : loc def lung L Cazul : oc B lung L Cazul : oc C lung L Caz : loc D lung L Caz : loc def lung L Caz : loc D Aceste declarații precizează că un fișier de segment de cod obiect numit rodata (însemnând „numai citire”) trebuie să conțină o secvență de șapte cuvinte „lungi” (de patru octeți), valoarea fiecărui cuvânt dată de adresa instrucțiunii asociate cu etichetele de asamblare specificate cod (de exemplu, L ) Eticheta oo marchează începutul acestei secvențe Adresa asociată cu această etichetă servește drept bază pentru sărituri indirecte (comanda ) Blocurile de cod de la label oc a la label oc d și label loc def în procedura switch eg impi din Lista - implementează cinci ramuri diferite ale instrucțiunii select Rețineți că blocul de cod etichetat ioc def este executat atunci când x este în afara intervalului - (în timpul verificării intervalului inițial) sau când valoarea acestei variabile este sau (pe baza tabelului de salt) Trebuie remarcat faptul că codurile blocului de program, marcate ca os v, se încadrează în blocul cu eticheta os s REZULTATE În funcția C de mai jos, am omis corpul instrucțiunii select În codul C corespunzător, etichetele de caz nu se întind pe un interval adiacent, iar unele cazuri sunt etichetate cu mai multe etichete Capitolul Reprezentarea programelor la nivel de mașină int switch (int x) { int rezultat = ; comutator (x) { /* Corpul instrucțiunii select este omis */ } returnează rezultatul; } Pentru această funcție, compilatorul generează cod de asamblare care urmează partea inițială a procedurii și tabelul de salt Variabila x este stocată într-o celulă decalată cu de adresa din registrul %ebp Organizarea accesului la masa de sărituri movl (%ebp),%eax Căutare x addl $ ,%eax cmpl $ ,%eax ja L jmp * LII(,%eax, ) Salt de tabel pentru instrucțiunea de selectare switch L : lung L lung N lung L lung L lung L lung L lung L Utilizați informațiile primite pentru a răspunde la următoarele întrebări: Care au fost valorile etichetelor case din corpul declarației select? Ce cazuri dintr-un program C au mai multe etichete? Proceduri Pentru a apela o procedură, este necesar să se transmită atât date (sub formă de parametri de procedură și valori returnate) cât și control dintr-o parte a codului programului în alta În plus, trebuie să alocați memorie pentru variabilele locale ale procedurii când o introduceți și să eliberați această memorie când ieșiți din procedură Majoritatea mașinilor, inclusiv cele cu arhitectură IA , execută doar comenzi simple pentru a transfera controlul și pentru a primi controlul de la proceduri Transferul de date, alocarea memoriei variabilelor locale și eliberarea acestei memorie la ieșirea din procedură se realizează prin operații de manipulare a stivei de programe Partea I Structura și execuția programului Structura cadrului stiva Programele pentru mașinile IA utilizează o stivă de software pentru a sprijini apelurile de procedură Stiva este folosită pentru a transmite argumente procedurii, pentru a stoca informațiile returnate și pentru a stoca conținutul registrelor pentru recuperarea lor ulterioară și ca memorie locală Partea stivei alocată pentru o procedură se numește cadru stivă (stack trame) Pe schema din fig Figura prezintă structura generală a unui cadru de stivă Stiva de sus rame vechi Numit Frame cadrul curent Orez Structura cadrului stiva Capitolul Reprezentarea programelor la nivel de mașină cadrul este limitat la doi pointeri, registrul %ebp servind ca indicator de cadru și registrul %esp ca indicator de stivă Pointerul de stivă se poate deplasa în timpul execuției unei proceduri, astfel încât majoritatea acceselor la informații sunt legate de indicatorul de cadru Să presupunem că procedura p (apelant, apelant) apelează procedura q (apelat, program apelat) Argumentele procedurii Q sunt conținute în cadrul stivă al procedurii p De asemenea, când p apelează Q, adresa de retur din p, de la care programul trebuie să-și reia execuția atunci când controlul revine de la Q, este împinsă pe stivă, formând capătul cadrului stivei lui p Cadrul stivei pentru procedura Q începe cu valoarea pointerului stivei stocată (adică %ebp), urmată de copii ale oricăror alte valori stocate în registre Procedura Q folosește, de asemenea, stiva pentru orice variabile locale care nu pot fi stocate în registre Acest lucru se poate întâmpla din următoarele motive: □ Nu există suficiente registre pentru a stoca toate datele locale în ele □ Unele dintre variabilele locale sunt matrice sau structuri și, din această circumstanță, ele sunt accesate folosind referințe de matrice și de structură A Operatorul de adresă & este aplicat uneia dintre variabilele locale și trebuie să putem calcula adresa pentru acesta În cele din urmă, Q folosește un cadru de stivă pentru a stoca argumente pentru toate procedurile pe care le numește După cum am observat mai devreme, stiva crește în direcția adreselor descrescătoare, indicatorul stivei din registrul %ebp indică elementul din partea de sus a stivei Datele pot fi stocate și, respectiv, preluate din stivă, folosind comenzile pushl și popi Spațiul de memorie pentru datele pentru care nu sunt specificate valori inițiale specifice poate fi alocat pe stivă prin simpla decrementare a indicatorului stivei cu cantitatea adecvată de memorie În mod similar, spațiul poate fi eliberat prin creșterea indicatorului de stivă Transferul controlului Comenzile care suportă apelurile de procedură și revenirea din proceduri sunt rezumate în Tabelul Tabelul Proceduri de apelare Descrierea comenzii caii Label Procedure apel caii * Operand Procedure call Lasă Pregătiți teancul pentru returnare ret Întoarcerea de la un apel Partea I Structura și execuția programului Comanda caii are ca tinta adresa comenzii de la care incepe procedura apelata La fel ca tranzițiile, un apel poate fi direct sau indirect În codul limbajului de asamblare, ținta unui apel direct este dată ca o etichetă, în timp ce ținta unui apel indirect este dată de un asterisc urmat de un specificator de operand, care are aceeași sintaxă ca cea utilizată pentru operandul instrucțiunii movl (vezi Tabelul ) Rezultatul executării comenzii caii este de a împinge adresa de retur în stivă și de a sări la începutul procedurii apelate Adresa de retur este adresa instrucțiunii imediat următoare instrucțiunii caii din program, astfel încât execuția programului se reia din acel punct când procedura apelată revine Instrucțiunea ret scoate adresa din stivă și transferă controlul în acea locație Utilizarea corectă a acestei instrucțiuni este ca indicatorul de stivă să indice întotdeauna locația în care instrucțiunea anterioară și-a amintit adresa de returnare Comanda ieave poate fi folosită pentru a pregăti stiva pentru returnare Aceasta este echivalentă cu următoarea secvență de coduri (Listing ): isting Pregătirea stivei: movl %ebp, %esp popi %ebp Setați indicatorul stivei la începutul cadrului Restabiliți valoarea salvată a registrului %ebp Setați indicatorul stivei la cadrul procedurii de apelare În schimb, această pregătire poate fi efectuată printr-o succesiune directă de operații de deplasare și împingere Registrul %eax este folosit pentru a returna valoarea oricărei funcții care returnează un număr întreg sau un pointer EXERCIȚIUL Următoarea bucată de cod este foarte comună în versiunile compilate ale programelor de bibliotecă: caii in continuare urmatoarele: popi %eax Ce valori sunt stocate în registrul %eax? Explicați de ce nu există o comandă ret corespunzătoare pentru această comandă caii? Ce scop util servește această bucată de cod? Convențiile de registru Setul de registre software acționează ca o singură resursă partajată de toate procedurile Și deși doar o singură procedură poate fi activă într-o condamnare Capitolul Reprezentarea programelor la nivel de mașină La un anumit moment în timp, trebuie să ne asigurăm că, dacă o procedură (procedura de apelare) apelează pe alta (procedura apelată), atunci aceasta din urmă nu suprascrie valorile anumitor registre care sunt programate pentru utilizare ulterioară Din acest motiv, arhitectura IA adoptă un set de reguli de registru unificate care trebuie urmate de toate procedurile, inclusiv de cele conținute în bibliotecile de programe Prin convenție, registrele %eax, %edx și %exx sunt clasificate ca registre de salvare a apelantului Când procedura Q este apelată de procedura p, este capabilă să suprascrie conținutul acestor registre fără a distruge datele de care are nevoie procedura P Pe de altă parte, registrele %ebx, %esi și %edi sunt clasificate ca registre de salvare pentru procedura numită Aceasta înseamnă că procedura Q trebuie să salveze valorile oricăruia dintre aceste registre pe stivă înainte de a scrie alte date în registru și să le restabilească înainte de a returna controlul, deoarece procedura P (sau orice altă procedură de nivel superior) poate avea nevoie de aceste valori pentru calcule viitoare În plus, registrele %ebp și %esp trebuie tratate conform convențiilor descrise aici Despre alegerea termenilor Luați în considerare următorul scenariu: int P() { int x = f(); /♦ Calcule concrete */ Q O ; întoarce x; Procedura p dorește ca valoarea lui x pe care a calculat-o să rămână neschimbată pe durata apelului la procedura Q Dacă x este în registrul de salvare al procedurii de apelare, atunci procedura P (procedura de apelare) trebuie să salveze acea valoare înainte de a apela Q și să o restabilească după ce Q revine Dacă x este în registrul de salvare al procedurii apelate și Q (procedura apelată) dorește să folosească acel registru, atunci procedura Q trebuie să salveze acea valoare înainte de a utiliza acel registru și să o salveze înainte de a reveni În ambele cazuri, amintirea înseamnă împingerea valorii registrului pe stivă, în timp ce restaurarea necesită scoaterea valorii din stivă și plasarea acesteia în registru Ca exemplu, luați în considerare următorul cod (lista - ): [Listing Utilizarea registrelor/ int P(int x) { int y = x*x; Partea I Structura și execuția programului int z = Q(y); cinci returnează y + z; } Procedura p evaluează y înainte de a apela Q, dar trebuie, de asemenea, să se asigure că valoarea lui y este disponibilă după ce Q a revenit Ea poate face acest lucru în unul dintre următoarele două moduri: □ Poate stoca valoarea în propriul cadru de stivă înainte de a se referi la q; când Q revine, poate scoate valoarea lui y din stivă □ Poate stoca valoarea lui y în registrul de salvare al procedurii apelate Dacă, sau orice altă rutină numită de rutina Q, intenționează să folosească acest registru, trebuie să stocheze valoarea pe cadrul stivei și să o restabilească înainte de a ceda Prin urmare, când Q revine la p, valoarea va fi deja în registrul de salvare al procedurii apelate, fie pentru că acel registru nu a fost modificat deloc, fie pentru că valoarea lui a fost salvată și apoi restaurată Cel mai adesea, compilatorul GCC folosește a doua convenție deoarece urmărește să reducă numărul total de scrieri în registru și citiri de registru INFORMAȚII Următoarea secvență de cod are loc chiar înainte de începutul codului limbajului de asamblare generat de compilatorul GCC pentru o procedură C pushl %edi pushl %esi pushl %ebx movl (%ebp),%eax imull (%ebp),%eax movl (%ebp), %ebx leal (,%eax, ),%ecx addl (%ebp),%ecx movl %ebx,%edx Vedem că doar conținutul a trei registre (%edi, %esi și %ebi) este stocat pe stivă Programul modifică apoi conținutul acestor trei registre, precum și alte trei registre (%eax, %exx și %edx) La sfârșitul acestei proceduri, registrele %edi, %esi și %ebi sunt resetate folosind comanda popi, în timp ce celelalte registre rămân în starea lor modificată Explicați de ce a apărut o astfel de discrepanță la salvarea și restaurarea conținutului registrelor (sau, pe scurt, restaurarea registrelor) Capitolul Reprezentarea programelor la nivel de mașină Exemple de procedură Ca exemplu, luați în considerare procedurile C prezentate în Lista Pe fig prezintă cadre de stivă pentru două proceduri Rețineți că procedura swap add își preia argumentele din cadrul stivei pentru procedura caiier Aceste celule sunt accesate relativ la indicatorul de cadru din registrul %ebp Numerele din stânga cadrelor indică decalajele de adrese în raport cu indicatorul de cadru Cadrul de stivă pentru procedura caiieg conține memorie pentru stocarea variabilelor locale argl și arg la pozițiile - și - față de indicatorul de cadru Aceste variabile trebuie să fie stocate pe stivă, deoarece trebuie să calculăm adrese pentru ele Următorul cod de asamblare din versiunea compilată a procedurii caiier arată cum această procedură apelează procedura de adăugare de schimb Zv^^ri^r'rbzyayp e> Stack frame caller argl Indicator de stivă %ezp -► - &arg + fiarg - fiargl + fiargl Pointer cadru %ebp = ) ; cincisprezece returnează rezultatul; } Aptr în %edx, Bptr în %ecx, rezultat în %esi, cnt în %ebx L : movl(%edx),%eax imull(%ecx),%eax addl %eax,%esi addl $ ,% ex addl $ ,%edx deci %ebx jns L buclă: Calculați t = *Aptr Calculați v = *Bptr * t Adăugați rezultatul v Adaugă la Bptr Adaugă la Aptr Decrement cnt dacă >=, mergi la buclă Rețineți că în acest cod, toate incrementele pointerului sunt înmulțite cu un factor de scalare de , în comparație cu codul C Partea I Structura și execuția programului EXERCIȚIUL Următorul cod C setează elementele diagonale ale matricei la val /* Setați toate elementele diagonale la val */ void fix set diag(fix natrix A, int val) { int i; pentru (i = ; i lementa' movl (%ebp), %edx movl (%ebp), %eax imull (%ebp), %eax addl (%ebp), %eax movl (%edx,%eax, ),%eax Adresa matricei A Index i Calculați n*i Calculați n*i + j Element de matrice A[i*n + j] Comparând acest cod cu ceea ce am folosit pentru a indexa matricea de dimensiuni fixe, vedem că versiunea dinamică este ceva mai complicată Operația de înmulțire ar trebui utilizată pentru a înmulți / cu factorul de scalare n în loc de o secvență de schimbare și adăugare de instrucțiuni Cu toate acestea, pentru procesoarele moderne, acest lucru nu duce la o scădere semnificativă a performanței Partea I Structura și execuția programului În multe cazuri, compilatorul poate simplifica calculul indicilor pentru tablourile de dimensiuni variabile, folosind aceleași principii care au fost folosite pentru calcularea indicilor elementelor matricelor de dimensiuni fixe De exemplu, Listatul prezintă codul C pentru calcularea indicilor /, k elemente ale produsului a două matrice ai de dimensiuni variabile Lista - prezintă o versiune optimizată a codului de asamblare obținută prin aplicarea unei metode de inginerie inversă la codul de asamblare construit prin compilarea versiunii originale Compilatorul este capabil să elimine multiplicarea întregului i*n și j*n din codul programului prin aplicarea schemei de acces secvenţial definită de structura buclei În acest caz, în loc să genereze o variabilă de tip pointer Bptr, compilatorul creează o variabilă pe care o vom numi nTjPk (l ori j plus l) deoarece valoarea ei este n*j+k Inițial, nTjPk este egal cu k și crește cu n la fiecare iterație typedef int *var matrix; /* Calculați elementul i,k al produsului matricelor de dimensiuni variabile */ int var jprod ele (var matrix A, var matrix B, int i, int k, int n) cinci { int j; int rezultat - ; opt pentru (j = ; j în acest scop Acesta este, rp->latime este echivalentul expresiei (*rp) lățime De exemplu, putem scrie o funcție care rotește un dreptunghi la stânga cu ° după cum urmează: void rotate left(struct rect *rp) { /* Schimbați lățimea și înălțimea */ int t = rp->înălțime; rp->înălțime = rp->lățime; rp->latime = t; } Obiectele C++ și Java sunt mai complexe în natură decât structurile C, în primul rând pentru că asociază un set de metode cu un obiect care poate fi apelat pentru a efectua anumite calcule În C, putem scrie aceste calcule ca funcții obișnuite, cum ar fi funcția agea sau rotate left prezentată mai devreme Ca exemplu, luați în considerare următoarea declarație de structură struct rec { int i; int j; int a[ ]; int*p; }; Această structură conține patru câmpuri: două câmpuri int de patru octeți, o matrice care conține trei elemente int de patru octeți și un pointer întreg de patru octeți— de octeți în total Acordați atenție faptului că tabloul a este încorporat în structură (Tabelul ) Numerele din linia de sus a diagramei arată decalajul câmpurilor în octeți față de începutul structurii Tabelul Adresarea structurii Offset Conținut i j a[ ] a[ ] a[ ] P Partea I Structura și execuția programului Pentru a accesa un anumit câmp al unei structuri, compilatorul generează cod care adaugă amestecul corespunzător la adresa structurii De exemplu, să presupunem că o variabilă r de tip struct rec * este în registrul %edx Următorul cod copia apoi elementul r->i în elementul r->j: movl(%edx),%eax movl %eax, (%edx) Luați r->i Salvați r-> j Deoarece offset-ul câmpului i este , adresa acestui câmp este pur și simplu valoarea lui r Pentru a stoca valoarea în câmpul j, codul adaugă un offset de la adresa lui r Pentru a construi un pointer către un obiect dintr-o structură, putem adăuga pur și simplu offset-ul câmpului corespunzător la adresa structurii De exemplu, construiți pointerul r->a[ ] adăugând offset-ul + * = variabila i în registrul %edx, putem obține valoarea pointerului cu o singură comandă: r este în %eax, i este în %edx leal (%edx,%ex, ),%ex %ex r->a[i] În concluzie, iată un exemplu în care codul programului implementează operatorul: r->p = &r->a[r->i + r->j]; Să începem prin a pune r în registrul %edx (Listul - ) unu movl (%edx), %eax addl(%edx),%eax Setați r->j Adăugați r->i leal (%edx,%eax, ),%eax Evaluează &r->[r->i + r->j] movl %eax, (%edx) Salvare r->p După cum arată Listarea - , procesarea diferitelor câmpuri ale structurii se face exclusiv în timpul compilării Codul nativ nu conține informații privind declarațiile de câmpuri sau numele câmpurilor EXERCIȚIUL ?l* Luați în considerare declarația următoarei structuri: struct prob { int *p; struct { intx; int y; }s; struct prob *next; Capitolul Reprezentarea programelor la nivel de mașină Această declarație arată că o structură poate fi imbricată în alta, în același mod în care matricele pot fi imbricate în structuri și alte matrice Următoarea procedură (unele expresii au fost omise) funcționează pe o structură void sp init(struct prob *sp) { sp->s x = ; sp->p= ; sp->next = ; } Care sunt offset-urile (în octeți) ale următoarelor câmpuri? R: s x: sy: Următorul: Câți octeți sunt necesari pentru a plasa această structură în memorie? Compilatorul generează următorul cod de limbaj de asamblare pentru corpul procedurii movl (%ebp)f %eax movl (%eax), %edx movl %edx, (%eax) leal (%eax),%edx movl %edx,(%eax) movl %eax, (%eax) Pe baza acestor informații, completați expresiile lipsă din textul sp init Asociațiile Uniunile oferă o modalitate de a ocoli sistemul de tip C, permițând referirea la un anumit obiect în funcție de mai multe tipuri Sintaxa pentru declararea unei uniuni este identică cu sintaxa pentru declararea structurilor, dar semantica lor este destul de diferită În loc de câmpuri care se referă la diferite blocuri de memorie, ele se referă la același bloc Luați în considerare următoarele declarații (lista ): struct S { char c; int i[ ]; Partea I Structura și execuția programului v dublu; }; unire U { char c; int i[ ] ; v dublu; Decalajele câmpurilor și dimensiunile totale ale tipurilor de date S și de la sunt prezentate în tabel : Tabelul Dimensiuni comune ale tipurilor de date Tip C i V Dimensiune S din (Vom vedea în scurt timp de ce i are un offset de în S și nu ) Pentru un pointer de unire p, p->c și p->i[ ] indică începutul structurii de date De asemenea, rețineți că dimensiunea totală a unei uniuni este egală cu dimensiunea câmpului său cel mai mare Unirile pot fi utile în mai multe contexte Totodata, pot fi surse de erori de programare deoarece ocolesc protectiile oferite de sistemul de tip C Uniunile pot fi folosite atunci cand se stie dinainte ca folosirea unuia dintre cele doua campuri exclude folosirea celuilalt Dacă declarați aceste două câmpuri ca parte a unei uniuni, puteți salva puțin spațiu de memorie De exemplu, să presupunem că vrem să construim o structură de date de tip arbore binar în care fiecare frunză (frunză) are un tip de date dublu, în timp ce nodul interior conține pointeri către două noduri secundare, dar fără date Să declarăm acest arbore ca structură (Listarea - ) „Lista Declarație de structură structNODE { struct NODE *stânga; struct NODE *dreapta; date duble Fiecare nod ar necesita octeți, jumătate din acești octeți fiind irosiți pe tip de nod Pe de altă parte, dacă declarăm un nod ca uniune (Listarea - ), atunci fiecare nod va necesita octeți Capitolul Reprezentarea programelor la nivel de mașină UNION NODE { struct { unire NOD *stânga; unire NOD *dreapta; } internai; date duble; }; Dacă n este un pointer către un nod union *, atunci ne putem referi la datele din frunză cu n->date, iar ramurile nodului intern cu n->internă stânga și n->internă dreapta Cu toate acestea, cu această codificare, nu este posibil să se determine dacă un anumit nod este o frunză sau un nod intern În acest caz, se adaugă de obicei un câmp de caracteristici speciale (Listing ): I Lista Câmp caracteristică * L L structNODE { int is leaf; unire { struct { struct NODE *stânga; struct NODE *dreapta; } internai; date duble; }informații; }; Câmpul ia valoarea pentru o frunză și pentru un nod intern Această structură necesită un total de octeți: octeți pentru este frunză și octeți fiecare pentru info internai left și info internai right sau octeți pentru info data În acest caz, economiile de memorie obținute prin utilizarea uniunii sunt mici din cauza volumului codului de program rezultat În cazul structurilor de date cu un număr mare de câmpuri, economiile de memorie pot fi mai semnificative Uniunile pot fi folosite pentru a accesa tipare de biți de diferite tipuri de date De exemplu, în Lista - , codul returnează o reprezentare de biți de tip fioat ca nesemnată: Partea I Structura și execuția programului unsigned float bit(float f) { unire { plutitor f; u nesemnat; } temp; temp f = f; retur temp u; }; În acest cod, stocăm un argument într-o uniune folosind un tip de date și îl accesăm folosind un alt tip de date Interesant este că codul generat de compilator pentru această procedură este identic cu codul generat pentru procedura din lista : așternut nesemnat (nesemnat și) { întoarcere și; } Corpul ambelor proceduri este doar o comandă: movl (%ebp),%eax Acest exemplu arată că nu există informații de tip în codul de asamblare Argumentul procedurii este situat la un offset de octeți față de valoarea din registrul %eax, indiferent dacă este de tip float sau nesemnat Această procedură pur și simplu își copiază argumentele ca valori returnate, fără ca niciun bit să-și schimbe valoarea Prin utilizarea uniunilor pentru a combina tipuri de date de diferite dimensiuni, problemele de ordonare a octetilor devin și mai presante De exemplu, să presupunem că am scris o procedură (Listarea - ) care creează un dublu de octeți folosind modelele de biți date de două valori fără semn de octeți dublu bit dublu (cuvânt nesemnatO, cuvânt nesemnat) { unire d dublu; Capitolul Reprezentarea programelor la nivel de mașină nesemnat și[ ]; } temp; temp and[ ] e wordO; temp and[ ] = wordl; retur temp d; unsprezece } Pe mașinile cu vârf (cel mai mic octet mai întâi), cum ar fi IA , argumentul cuvântO este plasat în cei patru biți cei mai puțin semnificativi ai lui d, în timp ce wordl este plasat în cei patru octeți cei mai semnificativi Pe mașinile stupide (cel mai mare octet mai întâi), rolurile ambelor argumente sunt inversate EXERCIȚIUL Luați în considerare următoarea declarație a sindicatului union ele { struct { int*p; int y; }el; struct { intx; union ele *next; }e ; }; Această declarație arată că structurile pot fi încorporate în uniuni Următoarea procedură (unele expresii au fost omise) operează pe o listă legată care are aceste uniuni ca elemente: void proc (union ele *up) { sus-> = * (sus-> ) - sus-> ; } Care va fi decalajul (în octeți) a următoarelor câmpuri: ei r: el y: e x: e următorul: Câți octeți sunt necesari în total pentru a găzdui această structură în memorie? Compilatorul generează următorul cod de limbaj de asamblare pentru corpul procedurii proc: Partea I Structura și execuția programului movl (%ebp), %eax movl (%eax), %edx movl (%edx)t %ecx movl %ebp,%esp movl (%eax)t %eax movl(%ecx), %ecx subl %eax,%ecx movl %ecx, (%edx) Pe baza acestor informații, completați expresiile lipsă din textul procedurii proc Unele referințe sindicale pot fi interpretări ambigue Astfel de ambiguități vor fi rezolvate dacă vă uitați la unde sunt direcționate aceste legături Există un singur răspuns, care nu efectuează nicio transformare a datelor și nu încalcă nicio condiție aliniere Multe sisteme informatice impun restricții asupra adreselor permise pentru tipurile de date simple, solicitând adresele pentru unele tipuri de obiecte să fie multipli ai unei valori specificate (de obicei , sau ) Respectarea unor astfel de restricții de aliniere simplifică designul hardware-ului care asigură interfața dintre procesor și sistemul de memorie De exemplu, să presupunem că procesorul preia octeți din memorie la o adresă care este un multiplu de de fiecare dată când accesează memorie Dacă ne putem asigura că orice valoare dublă este aliniată astfel încât adresa sa este un multiplu de , atunci acea valoare poate poate fi citit din memorie sau scrie în memorie într-o singură operație În caz contrar, va trebui să accesați memoria de două ori, deoarece obiectul poate fi localizat în două blocuri de memorie de octeți Hardware-ul arhitecturii IA va funcționa corect, indiferent de alinierea datelor Cu toate acestea, Intel recomandă alinierea datelor pentru a îmbunătăți performanța sistemului de memorie Sistemul de operare Linux urmează o strategie de aliniere prin care tipurile de date de octeți (cum ar fi tipul scurt) trebuie să aibă adrese care sunt multipli de doi, în timp ce tipurile de date mai mari (cum ar fi int, int*, float și double) trebuie să aibă adrese , multipli de Rețineți că această cerință înseamnă că bitul cel mai puțin semnificativ al adresei unui obiect de tip scurt trebuie să fie În mod similar, orice obiect de tip int sau orice pointer trebuie să fie localizat în memorie la o adresă ale cărei două biții sunt egali cu zero Alinierea în Microsoft Windows Microsoft Windows impune o cerință de aliniere mai strictă — orice obiect ^-octet (simplu) trebuie să aibă o adresă care este un multiplu al lui k În special, adresa valorii duble trebuie să fie un multiplu de Procedând astfel, se îmbunătățește performanța memoriei în detrimentul unei supraîncărcări de memorie Deciziile de proiectare luate în Capitolul Reprezentarea programelor la nivel de mașină Linux, au fost justificate fără îndoială pentru procesoarele de tip I când dimensiunile RAM erau mici și magistralele de memorie erau de biți La procesoarele moderne, alinierea Microsoft este o alegere mai bună de design Indicatorul de linie de comandă -malign-double face ca compilatorul GCC Linux să folosească alinierea pe octeți pentru tipul de date dublu Acest lucru îmbunătățește performanța memoriei, dar provoacă și inconsecvențe la editarea legăturilor către codul bibliotecii care a fost compilat la aliniere pe octeți Alinierea se realizează automat dacă se garantează că fiecare tip este organizat și plasat în memorie în așa fel încât fiecare obiect de un anumit tip să satisfacă condițiile de aliniere Compilatorul plasează directive în coduri de limbaj de asamblare, specificând alinierea adecvată pentru datele globale De exemplu, tabelul de salt declarat în codul de asamblare (Listarea - ) conține următoarea directivă pe linia : aliniază Acest lucru asigură că datele care urmează (în cazul unui început de tabel de salt) încep la o adresă care este un multiplu de Deoarece fiecare intrare de tabel are o lungime de octeți, elementele ulterioare sunt supuse unei condiții de aliniere de octeți Programele de bibliotecă de alocare a memoriei, cum ar fi malloc, trebuie să fie proiectate astfel încât să poată returna un pointer care îndeplinește cele mai stricte condiții de aliniere pentru mașinile pe care rulează, de obicei o cerință de multiplu de sau Pentru codul care rulează cu structuri, compilatorul trebuie adesea să facă inserări atunci când alocă memorie pentru câmpuri, astfel încât fiecare element al structurii să-și satisfacă cerințele de aliniere În astfel de cazuri, adresa de pornire a structurii este, de asemenea, aliniată Luați în considerare, de exemplu, următoarea declarație de structură: struct S { int i; char c; int j ; ); Să presupunem că compilatorul a folosit alocarea minimă de octeți prezentată în Tabelul Tabelul Alocare de nouă octeți Offset Conținut i cu j Partea I Structura și execuția programului În acest caz, nu este posibilă îndeplinirea cerinței de aliniere de octeți pentru ambele câmpuri i (offset ) și j (offset ) În schimb, compilatorul inserează trei octeți (prezentați ca xxx în Tabelul ) între câmpurile c și j Tabelul Aliniere la cerere Offset Conținut i cu XXX j Ca rezultat, câmpul j are un offset de , iar dimensiunea totală a structurii este de octeți Mai mult, compilatorul trebuie să se asigure că orice pointer p de tip structura * a îndeplinit condiția de aliniere pe octeți Folosind notația anterioară, să presupunem că indicatorul p are valoarea xp Atunci xp trebuie să fie un multiplu de Acest lucru asigură că atât p->i (adresa xp) cât și p->j (adresa xp+ ) satisfac cerința de aliniere de octeți În plus, poate fi necesar ca compilatorul să umple capătul structurii cu spații pentru a se asigura că fiecare element al matricei de structuri satisface cerința de aliniere De exemplu, luați în considerare următoarea declarație de structură: struct S { int i ; int j; char c; }; Dacă alocam octeți pentru această structură, putem încă îndeplini condiția de aliniere pentru câmpuri de octeți dacă alegem adresa de pornire a acestei structuri ca multiplu de Acum luăm în considerare următoarea declarație: struct S d[ ]; Dacă pentru această structură sunt alocați octeți, atunci este imposibil să se îndeplinească condiția de aliniere pentru fiecare element al structurii d, deoarece aceste elemente vor avea adrese xd, xd + , xd + , xd + În schimb, compilatorul va aloca octeți structurii, în timp ce ultimii trei octeți nu sunt utilizați (Tabelul ) Tabelul Descrierea structurii Offset Conținut i c c XXX Prin urmare, elementele de structură vor avea adrese xd, xd+ , xd+ , xd+ Deoarece xd este un multiplu de patru, toate condițiile de aliniere vor fi îndeplinite Capitolul Reprezentarea programelor la nivel de mașină EXERCIȚIUL Pentru fiecare dintre următoarele declarații de structură, determinați decalajul fiecărui câmp, dimensiunea totală a structurii și cerințele de aliniere a acestora în sistemul de operare Linux și arhitectura IA struct PI { int i; char c; int j; mătgul; }; struct P { int i; char c; mătgul; int j; }; struct P { scurt w[ ]; char c[ ] }; struct P { short w[ ]; char *c[ ] }; struct P { struct PI a[ ]; struct P *p }; Cum să folosiți pointerii Pointerii sunt una dintre principalele caracteristici ale limbajului de programare C Ele oferă o modalitate universală de a accesa de la distanță structurile de date Indicatorii sunt adesea o sursă de confuzie pentru programatorii începători, dar ideile din spatele acestor concepte sunt destul de simple Codul din Lista - ne permite să ilustrăm o listă a acestor idei □ Fiecare indicator are un tip Acest tip indică ce tip de obiect indică În codul nostru exemplu, vedem următoarele tipuri de pointer (Tabelul ) Rețineți că în acest tabel specificăm tipul indicatorului în sine, precum și tipul obiectului către care indică În general, dacă obiectul este de tip T, atunci indicatorul este de tip *T Tipul special void* reprezintă un pointer de grup De exemplu, funcția malloc returnează un pointer de grup, care este convertit într-un pointer tastat printr-o distribuție adecvată (linia din Listarea - ) Tabelul Tipuri de pointer Tip pointer Tip obiect Pointeri int * union uni * int union uni xp, ip[ ], ip [ ] up □ Fiecare indicator contează Această valoare este adresa unui obiect de tipul dat Valoarea specială NULL ( ) corespunde situației în care pointerul nu indică nimic Vom vedea în curând sensul indicatorilor pe care le folosim □ Pointerii sunt creați folosind operatorul C & Acest operator poate fi aplicat oricărei expresii C care este caracterizată ca o ivaloare, ceea ce înseamnă o expresie care poate apărea în partea stângă a unei instrucțiuni de atribuire Exemplele corespondente sunt elementele structurilor, Partea I Structura și execuția programului uniuni și matrice În exemplul nostru de cod, acest operator este aplicat variabilei globale g (linia din Listarea - ), membrului struct sv (linia din Listarea - ) și membrului uniunii ip->v (linia din listatul - ) și variabilei locale x (linia din listarea - ) □ Pointerii sunt dereferențiați folosind operatorul * Rezultatul este o valoare de tipul asociat indicatorului Vedem că dereferința se aplică obiectelor ip și *ip (linia din Listarea - ), ip[ ] (linia din Listarea - ) și xp (linia din Listarea - ) Împreună cu aceasta, expresia ip->v (linia din Listarea - ) nu numai că dereferențează indicatorul ip, dar selectează și câmpul ѵ □ Matricele și pointerii sunt strâns legate între ele Un nume de matrice poate fi referit (dar nu actualizat) ca și cum ar fi o variabilă pointer O referință matrice (de ex a[ ]) are exact același rezultat ca și aritmetica pointerului (de ex *(a+ )) Întâlnim acest lucru în linia din Listarea - , în care tipărim valoarea pointerului către tabloul ip și ne referim la primul său element (element ) cu *ip □ Pointerii pot indica funcții Acest lucru oferă o oportunitate ample pentru salvarea și transmiterea referințelor la codul programului care poate fi apelat în alte părți ale programului Vedem acest lucru în variabila f (linia din Lista - ), care a fost declarată ca o variabilă care indică o funcție care ia un int * ca argument și returnează void Această misiune face ca f să arate acum spre distracție Când vom folosi mai târziu f (linia din listarea - ), va fi un apel recursiv L Listarea Program care ilustrează utilizarea indicatoarelor struct stg { /★ Exemplu de structură ★/ int t; charv; }; cinci uniune uni { /★ Exemplu de unire ★/ intt; charv; }u; int g = ; void fun(int*xp) paisprezece { void (*f)(int*) = distracție; /* f este un indicator de funcție */ Capitolul Reprezentarea programelor la nivel de mașină optsprezece /★ Împingeți structura pe stivă */ struct str s = { ,'a'}; /* Inițializarea structurii */ nouăsprezece /* Plasează uniunea în memoria heap */ union uni *up = (union uni *) malloc(sizeof(union uni)); /* Matrice declarată local ★/ int *ip[ ] = {xp, &g}; sus->v = s v+ ; printf("ip = %p, *ip = %p, **ip = %d\n", ip, *ip, **ip); printf("ip+l = %p, ip[l] = %p, *ip[l] = %d\n", ip+ , ip[l], *ip[l]); printf("&s v = %p, sv = ^c'Xn", &s v, sv); prințf("&up->v = %p, up->v = '%c'\n", &up->v, up->v); printf("f = %p\n", f); dacă (- (*xp) > ) f(xp); /★ Apel recursiv la distracție ★/ } test() { int x = ; distracție(&x); întoarce x; } Indicatori de funcție Sintaxa pentru declararea indicatorilor de funcție este destul de complicată de înțeles pentru utilizatorii începători Pentru a înțelege ce este în joc, declarații precum următoarele: void(*f)(int*); este util să citiți din interior (cu „f”) și să vă gândiți la ieșire Așa că vedem că f este un pointer, așa cum demonstrează partea (*f) Această parte este un pointer către o funcție care are unul int* argument, această concluzie rezultă din fragment (*f)(int*) În cele din urmă, vedem că această declarație este un indicator de funcție care ia un int * ca argument și returnează void Partea I Structura și execuția programului Parantezele din jurul *f sunt necesare deoarece altfel declarația void *f(int*); va fi perceput ca (void *) f(int*); Adică, va fi interpretat ca un prototip de funcție care declară o funcție f care ia un int* ca argument și returnează void * Kernighan și Ritchie [ ] prezintă un tutorial foarte util care intră în detaliu despre caracteristicile declarațiilor în limbajul de programare C Codul pe care l-am citat conține un număr de apeluri la funcția printf, care tipărește unele dintre indicatorii (folosind directiva %p) și valori Când este utilizat, generează următoarea ieșire (Listarea - ): aaaa:*: ^ Lista Ieșire R = xbfffefa , *ip = xbfffefe , **ip = ip+ = Oxbfffefac, ip[l] = x c, *ip[l] = &S V = xbfffefb , S V = „a” &up->v = x , up->v = 'b' f = x IP = xbfffef , *ip = xbfffefe , **ip = ip+ = xbffff c, ip[l] = x c, *ip[l] = &S V = xbffff , S V = 'a' &up->v = x , up->v = 'b' f = x Vedem că această funcție este executată de două ori: în primul rând, este apelată direct din instrucțiunea de testare (linia din listarea - ), urmată de un apel indirect recursiv (linia din listarea - ) Vedem că toate valorile pointerului imprimate corespund adreselor Cele care indică adrese încep cu valoarea Oxbfffef, indică locații de stivă, în timp ce restul sunt adrese de memorie globale ( x c), parte din codul executabil ( x ) sau locații heap ( x și x ) Instanțe ale matricei ip sunt create de două ori, o dată pentru fiecare apel la distracție A doua valoare ( xbfffef ) este mai mică decât prima valoare ( xbfffef ) deoarece stiva crește în jos Cu toate acestea, conținutul matricei rămâne același în ambele cazuri Elementul (*ip) este un pointer către variabila x din cadrul stivei pentru funcția de testare Elementul este un pointer către variabila globală g Este ușor de observat că structura s este creată de două ori și de ambele ori pe stivă, în timp ce indicatorul către uniunea situată în zona de memorie alocată dinamic este variabila u Capitolul Reprezentarea programelor la nivel de mașină Și, în sfârșit, variabila f este un pointer către funcția fun În codul (lista - ), obținut prin asamblare inversă, găsim următorul fragment, care servește drept cod inițial pentru funcția fun: Listare Z bb Initialcode : : push %ebp : e mov %esp,%ebp : eu s sub $ xlc,%esp a: push %edi Valoarea x tipărită pentru indicatorul f este adresa exactă a primei instrucțiuni din fun Trecerea funcției parametru Alte limbaje de programare, cum ar fi Pascal, oferă două modalități de a transmite parametrii unei proceduri — după valoare, în care procedura de apelare furnizează valorile reale ale parametrilor și prin referință, în care procedura de apelare furnizează pointeri către valorile reale În C, toți parametrii sunt transferați după valoare, dar putem imita rezultatul unui parametru de referință specificând în mod explicit un pointer către valoare și trecând acel pointer către o procedură Am văzut cum se face acest lucru cu funcția fun cu xp ca exemplu În timpul apelului inițial la fun(&x) (linia ), acestei funcții i se transmite o referință la variabila locală x în funcția de testare Valoarea acestei variabile este decrementată de fiecare dată când este apelată fun (linia ), astfel încât recursiunea se oprește după două apeluri Limbajul C++ a reintrodus noțiunea de transmitere a parametrilor prin referință, dar mulți cred că aceasta a fost o greșeală Folosind GDB Debugger Depanatorul GNU GDB oferă o serie de facilități utile pentru a sprijini evaluarea și analiza programelor la nivel de mașină în timp ce acestea rulează În exemplele și exercițiile din această carte, încercăm să evaluăm comportamentul unui program pe baza analizei codului Utilizarea depanatorului GDB vă permite să studiați un program urmărindu-l rulând, menținând în același timp un control mare asupra execuției sale În tabel Figura oferă câteva exemple de comenzi de depanare GDB care vă vor fi utile atunci când lucrați cu programe la nivel de mașină care vizează arhitectura IA Este foarte util să rulați mai întâi programul OBJDUMP pentru a obține versiunea de asamblare inversă a acestor programe Exemplele noastre se bazează pe execuția GDB pe fișierul prog, a cărui descriere, precum și dezasamblarea Partea I Structura și execuția programului o versiune analizată este prezentată în Listarea Pornim GDB cu următoarea linie de comandă: unix > gdb prog Schema generală este că punctele de control sunt amplasate în locuri de interes din program Acestea pot fi setate imediat după intrarea în funcție sau la adresa programului Când programul atinge unul dintre punctele de întrerupere în timpul execuției, se oprește și transferă controlul utilizatorului În timp ce ne aflăm într-un punct de control, putem examina diverse registre și locații de memorie de diferite formate De asemenea, putem intra în modul de execuție pas cu pas al programului, executând doar câteva comenzi de fiecare dată sau să trecem direct la următorul punct de control După cum arată exemplul nostru, depanatorul GDB nu are o sintaxă de comandă foarte clară, dar informațiile de ajutor online (apelate de la GDB prin comanda de ajutor) depășesc acest neajuns Tabelul Comenzi de depanare Rezultatul execuției comenzii Porniți și opriți ieșiți Ieșiți din depanatorul GDB rulați Rulați programul (puneți aici argumentele liniei de comandă) kill Oprește-ți programul Puncte de întrerupere break sum Setați un punct de întrerupere la intrarea funcției de sumă break x c Setați un punct de întrerupere la x c ștergeți ștergeți punctul de întrerupere şterge Şterge toate punctele de întrerupere Performanţă stepi Executați o comandă spepi Rulați patru comenzi nexti Ca stepi, dar realizat printr-un apel de funcție continua Reluează execuția finish Executați până când este primită returnarea funcției curente Capitolul Reprezentarea programelor la nivel de mașină Tabelul (sfârșit) Rezultatul execuției comenzii Analiza codului programului disas Efectuați asamblarea inversă a funcției curente disas sum Efectuați asamblarea inversă a funcției de sumă disas x b Efectuați asamblarea inversă a funcției în vecinătatea adresei x b disas x b x b Efectuați asamblarea inversă a codului programului în intervalul de adrese prinț /x Seip Imprimați programul în format hexazecimal Analiza datelor prinț %eax Tipăriți conținutul registrului %eax în format zecimal prinț /x %eax Tipăriți conținutul registrului %eax în format hexazecimal prinț /t %eax Tipăriți conținutul registrului %eax în format binar prinț x Tipăriți x în notație zecimală prinț /x Print in hex prinț /x) (%ebp+ ) Tipăriți conținutul registrului (%ebp+ ) în notație zecimală prinț *(int *) xbffff Tipăriți întregul la adresa xbffff prinț *(int *) (%ebp+ ) Imprimați întregul la adresa (%ebp+ ) x/ w xbffff Vedeți două (cuvinte de octeți) începând cu xbffff x/ b sum Vedeți primii de octeți ai funcției de sumă Informații utile cadru de informații Informații despre cadrul de stivă curent registre de informații Valorile tuturor registrelor ajutor Furnizarea de informații despre depanatorul GDB Partea I Structura și execuția programului Referințe de celule de memorie și depășiri de buffer Am văzut mai sus că C nu efectuează verificări ale limitelor referințelor de matrice și că variabilele locale sunt stocate în stivă împreună cu informații de stare, cum ar fi valorile registrului și pointerii de returnare Această combinație poate duce la erori grave de programare atunci când starea stocată pe stivă este coruptă prin scrierea elementelor matrice ale căror valori sunt în afara limitelor Atunci când programul încearcă să reîncarce un registru sau să emită o instrucțiune ret cu o astfel de stare coruptă, acest lucru poate duce la consecințe grave Cea mai frecventă cauză a unei stări corupte este o depășire a tamponului Destul de des, matricele de caractere sunt plasate pe stivă pentru a stoca un șir, dar dimensiunea șirului depășește spațiul alocat pentru această matrice Acest lucru poate fi ilustrat cu următorul program (lista - ) /* Implementarea funcției de bibliotecă gets() */ caractere *gets(char *s) { int c; caractere *dest = s; în timp ce ((c " getcharO) != '\n' && c != EOF) *dest++ - c; *dest++ = '\ '; /★ Sfârșitul rândului */ dacă (c=EOF) returnează NULL; întoarcere s; } /* Citiți linia de intrare și scrieți-o înapoi */ void echo() { charbuf[ ]; /* Calea prea mică */ gets(buf); pune(buf); douăzeci } Codul din Lista - este o implementare a funcției de bibliotecă gets și arată cum această funcție poate cauza probleme serioase Citește o linie de la intrarea standard și se oprește numai când întâlnește o linie nouă sau Capitolul Reprezentarea programelor la nivel de mașină vreo situație de eșec Copiază șirul în locația de memorie specificată de argumentul s și termină șirul de intrare cu un caracter spațiu Vă vom arăta cum să utilizați funcția gets când ne uităm la funcția echo, care pur și simplu citește o linie de la intrarea standard și o trimite la ieșirea standard (Figura ) %ehp Orez Organizarea stivei pentru funcția ecou Problema cu funcția gets este că nu există nicio modalitate de a determina dacă are suficient spațiu de memorie pentru a păstra întregul șir În exemplul nostru de eco, am ales în mod deliberat un buffer foarte mic: este proiectat să conțină doar patru caractere Orice șir mai lung de trei caractere va provoca o intrare în afara limitelor Examinarea unei părți a codului limbajului de asamblare pentru funcția echo vă permite să înțelegeți cum este organizată stiva (lista - ) Ifistig / Organizarea stivei ecou: Apăsați %ebp Salvați \%ebp pe stivă movl %esp,%ebp subl $ ,%esp Alocați memorie stivă pushl %ebx Salvați \%ebx addl $- ,%esp Alocați mai mult spațiu în stivă leal - (%ebp), %ebx Calculați adresa buf ca \%ebp- pushl %ebx Împinge buf pe stivă caii gets Apelați funcția gets Putem vedea în acest exemplu, programul a alocat un total de de octeți (liniile și ) memoriei locale Cu toate acestea, adresa matricei este cu octeți mai mică decât valoarea stocată în registrul %ebp (linia din Listarea - ) Pe fig arată cele primite Partea I Structura și execuția programului structura stivei Este ușor de observat că orice scriere în celulele de la buf [ ] la buf [ ] face ca valoarea registrului %ebp să fie coruptă Mai târziu, când programul încearcă să recupereze această valoare ca indicator de cadru, toate referințele ulterioare de stivă vor fi invalide Orice scriere în celule buf[ ] până la buf[ ] va face ca adresa de retur să fie coruptă Când comanda ret este executată în etapa finală a execuției funcției, programul se va „întoarce” la adresa greșită După cum arată acest exemplu, depășirile de buffer conduc la distorsiuni serioase în comportamentul programului Codul funcției echo pe care l-am compilat este simplu, dar brut O versiune mai avansată folosește funcția fget, care ia numărul maxim de octeți de citit ca argument Exercițiul vă provoacă să scrieți o funcție ecou care poate gestiona șiruri de intrare de lungime arbitrară În general, utilizarea funcției gets sau a oricărei alte funcții care poate depăși memoria este considerată o practică de programare proastă Compilatorul C chiar emite următorul mesaj de eroare atunci când compilează un fișier care conține un apel la funcția gets: gets este periculos și nu trebuie folosit (Listings - ) I Lista Cod de program în funcțiile C /* Acest cod este de foarte slabă calitate Servește ca o ilustrare a practicii proaste de programare Vezi practica */ caractere *getline() cinci { charbuf[ ]; caractere *rezultat; gets(buf); rezultat = malloc(strlen(buf)); strcpy(rezultat, buf); returnare(rezultat); } Lista Cod obținut prin asamblare inversă : : push %ebp : e mov %esp,%ebp : es sub $ x ,%esp a: împinge %esi b: împinge %ebx Diagrama de stivă în acest moment c: c f adăugați $ xffffff ,%esp f: d d f lea xffffff (%ebp),%ebx Capitolul Reprezentarea programelor la nivel de mașină : împinge %ebx : e fe ff ff cai O ac UP PA* unele Codul din listele - și - este o implementare (de calitate scăzută) a unei funcții care citește valori temporare de la intrarea standard, copiază șirul în memoria nou alocată și returnează un pointer la rezultat Luați în considerare următorul scenariu: procedura getline este apelată, adresa sa de retur este x , conținutul %ebp este xbffffc , conținutul %esi este x și conținutul %ebx este x Introduceți șirul „ ” de la tastatură Programul se oprește din cauza unei erori de segmentare Rulați depanatorul GDB și aflați că a apărut o eroare la executarea comenzii getline ret Completați tabelul de mai jos cu toate informațiile pe care le cunoașteți despre starea stivei după executarea instrucțiunii de pe linia a codului de asamblare Etichetați în mod corespunzător valorile numerice stocate pe stivă (de exemplu, „adresa de retur”) și introduceți valorile lor hexazecimale (dacă sunt cunoscute) în caseta din dreapta Fiecare celulă corespunde la octeți Specificați poziția de registru %ebp Modificați diagrama pentru a arăta consecințele apelării funcției gets (linia ) La ce adresa va returna programul controlul? Valoarea (valorile) a cărui registru(e) vor fi corupte atunci când programul își recapătă controlul? Pe lângă posibilitatea depășirii buffer-ului, care sunt alte două dezavantaje ale programului getline? Consecințele vor fi mult mai devastatoare decât un buffer overflow dacă forțați un program să îndeplinească o funcție căreia nu îi aparține Aceasta este una dintre metodele utilizate pe scară largă pentru testarea protecțiilor sistemului în rețelele de calculatoare De obicei, în program se introduce un șir care conține codurile programului de lucru, reprezentate în octeți, numit cod de exploatare, plus câțiva octeți suplimentari care suprascriu pointerul de returnare din buffer, înlocuindu-l cu un pointer către codul programului din tampon Rezultatul executării comenzii ret este tranziția sa necondiționată la codul fals Ca o formă a unui astfel de atac de securitate, codul fals solicită apoi sistemului să ruleze un program shell care permite atacatorului să profite de unele dintre numeroasele caracteristici ale sistemului de operare Într-o altă formă, codul simulat efectuează o altă sarcină neautorizată, remediază corupția stivei și apoi Partea I Structura și execuția programului execută comanda ret a doua oară, dând iluzia (aparentă) de a reveni controlul în mod normal programului apelant Un exemplu este celebrul vierme software care a apărut pe Internet în noiembrie , care a folosit patru metode diferite pentru a obține acces la multe computere Unul dintre acestea a fost un atac de depășire a tamponului pe fingerd, care servește cererile de la comanda finger Prin executarea comenzii finger pe linia corespunzătoare, viermele ar putea provoca o depășire a memoriei tampon către demonul de la site-ul la distanță și ar putea executa cod care ar permite accesul la sistemul de la distanță Odată ce un vierme a obținut acces la un sistem de la distanță, a fost capabil să se reproducă și să consume practic toate resursele de calcul ale mașinii Drept urmare, sute de mașini au fost practic paralizate până când experții în securitate au găsit o modalitate de a ucide viermele Autorul acestui program a fost demascat și urmărit penal El a fost condamnat la trei ani de încercare, de ore de muncă în folosul comunității și o amendă de de dolari Cu toate acestea, până în prezent există oameni care caută slăbiciuni în sisteme care le-ar permite să efectueze atacuri de depășire a tamponului Toate acestea evidențiază necesitatea unei programari mai atente Orice interfețe cu sisteme externe trebuie să fie „antiglonț”, astfel încât nicio acțiune a agenților externi să nu forțeze sistemul să-și schimbe comportamentul Viermi și viruși Atât viermii, cât și virușii sunt bucăți de cod software care tind să se răspândească pe alte computere Conform definiției lui Spafford [ ], un vierme este un program care poate rula singur și poate distribui o versiune complet funcțională a lui către alte mașini Un virus este o porțiune a codurilor de program care se adaugă la alte programe, inclusiv la sistemele de operare Nu poate fi executat singur În mass-media, termenul „virus” este folosit ca termen general pentru diverse strategii de răspândire a codului rău intenționat între sisteme, așa că este obișnuit să auzim că oamenii numesc un virus ceea ce s-ar numi mai corect „vierme” În ex puteți câștiga o anumită abilitate în efectuarea unui atac de depășire a tamponului Vă rugăm să rețineți că nu acceptăm nicio metodă de a obține acces neautorizat la sisteme Intrarea într-un sistem informatic, ca și intrarea ilegală în apartamentul altcuiva, este o faptă penală, chiar dacă cel care a comis-o nu și-a propus un scop penal Includem acest exercițiu aici din două motive: în primul rând, necesită cunoștințe profunde de programare în limbajul mașinii și trebuie să înțelegeți organizarea stivei, endianitatea și codurile de instrucțiuni În al doilea rând, arătându-vă cum se dezvoltă un atac de buffer overflow, sperăm că înțelegeți importanța scrierii codului care previne acest tip de atac Capitolul Reprezentarea programelor la nivel de mașină Lupta Microsoft prin depășirile de buffer În iulie , Microsoft a introdus noul său sistem de mesagerie instant (IM), ai cărui clienți puteau interacționa cu serverele populare AOL (America Online) Cu toate acestea, în decurs de o lună, utilizatorii au pierdut brusc și în cel mai misterios mod abilitatea de a efectua corespondență interactivă cu utilizatorii Microsoft a lansat programe client actualizate care au reluat serviciile către sistemul AOL IM, dar doar câteva zile mai târziu, acești clienți au încetat să mai funcționeze Cumva, AOL a reușit să afle că unul dintre utilizatori rula o versiune a clientului AOL IM, în ciuda faptului că Microsoft a încercat periodic să reproducă protocolul AOL IM în programele sale client Codul clientului era vulnerabil la atacuri, cum ar fi depășirile de buffer Este posibil ca AOL să fi luat această poziție cu privire la această problemă în mod neintenționat, deoarece a folosit acest bug pentru a expune fraudatorii atacând clientul în timp ce utilizatorul se autentifica Codul folosit de AOL a selectat un număr mic de celule din imaginea clientului din memorie, le-a împachetat într-un pachet de rețea și le-a trimis înapoi la server Dacă serverul nu a primit un astfel de pachet, sau pachetul primit de server nu se potrivea cu „amprenta” așteptată a clientului AOL, atunci serverul a concluzionat că clientul nu era client AOL și a refuzat accesul Astfel, dacă alte clienți, cum ar fi De exemplu, clienții Microsoft care încearcă să acceseze serverele AOL IM, aceștia trebuie nu numai să încorporeze o eroare de depășire a memoriei tampon de software care era tipică pentru clienții AOL, ci și să aibă cod binar și date identice în locațiile de memorie corespunzătoare Clienții AOL stocați conținutul adecvat din aceste celule și distribuie noi versiuni ale programelor client clienților, aceștia puteau face cu ușurință modificări la codurile fictive, astfel încât să selecteze alte celule din imaginea clientului în memorie Acesta a fost un adevărat război pe care l-au făcut clienții non-AOL nu putea câștiga Acest episod a avut o serie de întorsături neașteptate Informațiile despre o eroare în programele client și modul în care AOL le-a folosit pentru prima dată au devenit publice atunci când o persoană pe nume Phil Bucking, care s-a prezentat ca consultant independent, i-a trimis-o prin e-mail lui Richard Smith, un specialist binecunoscut pentru protecția informațiilor Smith a făcut câteva cercetări și a stabilit că sursa mesajului de e-mail a fost Microsoft Corporation Microsoft a recunoscut ulterior că unul dintre angajații săi a trimis acest mesaj către Microsoft Cealaltă parte a acestui conflict, AOL, nu a recunoscut niciodată prezența unui bug în produsele și utilizarea sa software, chiar dacă Geoff Chapell (Australia) a prezentat dovezi convingătoare Deci cine a încălcat și al cui cod de conduită a fost încălcat în acest incident? În primul rând, AOL nu și-a luat niciun angajament de a-și deschide sistemul pentru clienții non-AOL, așa că blocarea Microsoft nu a fost ilegală Pe de altă parte, Partea I Structura și execuția programului exploatarea depășirilor de buffer pare a fi o afacere discutabilă O mică eroare software ar putea dezactiva complet computerele client și, de asemenea, a făcut sistemele client mai vulnerabile la atacurile de la agenți externi (deși nu existau dovezi directe că acestea au avut loc) Microsoft ar face bine să anunțe public intențiile AOL de a exploata depășirile de buffer Cu toate acestea, un truc al purtătorului de cuvânt al lor, Phil Bucking, s-a dovedit a fi o încercare eșuată de a răspândi cuvântul, atât din punct de vedere etic, cât și din punct de vedere al relațiilor publice Codurile în virgulă mobilă Setul de instrucțiuni pentru manipularea valorilor în virgulă mobilă este una dintre cele mai puțin elegante caracteristici ale arhitecturii IA La primele mașini Intel, operațiunile în virgulă mobilă erau efectuate de un coprocesor separat, un dispozitiv cu propriile registre și putere de procesare, care executa un subset de instrucțiuni Acest coprocesor a fost implementat ca plăci separate, numite , și I , care au servit drept aplicații pentru procesoarele , și, respectiv, I Puterea plăcilor din această generație de hardware a fost insuficientă pentru a instala procesorul principal și coprocesorul în virgulă mobilă pe aceeași placă În plus, mașinile cu putere redusă pur și simplu renunță la operațiunile în virgulă mobilă și le implementează în software (cu performanțe excepțional de lente) Începând cu modelul І , hardware-ul care efectuează operațiuni pe valori în virgulă mobilă a devenit parte integrantă a CPU cu arhitectura IA Primul coprocesor a fost introdus cu fanfară în A fost prima FPU (Unitate în virgulă mobilă) pe o singură placă și prima implementare a ceea ce este astăzi cunoscut sub numele de virgulă mobilă IEEE Funcționând ca un coprocesor, dispozitivul interceptează execuția operațiilor în virgulă mobilă după ce aceste operațiuni ajung la procesorul principal Există o comunicare minimă între procesorul principal și FPU Transferul datelor de la un procesor la altul necesită ca procesorul expeditor să scrie date în memorie, iar procesorul receptor să citească acele date În plus, tehnologia de compilare în era mult mai simplă decât este astăzi Multe caracteristici ale arhitecturii IA care sunt orientate spre procesarea valorilor în virgulă mobilă sunt o sarcină dificilă pentru optimizarea compilatoarelor Registre în virgulă mobilă Unitatea în virgulă mobilă conține opt registre în virgulă mobilă, dar acestea sunt tratate ca o stivă superficială, spre deosebire de registrele normale Registrele sunt numerotate ca %ged( ), %ged{ ), etc până la %ged{ ), Capitolul Reprezentarea programelor la nivel de mașină în timp ce în partea de sus a stivei este %reg{ ) Dacă mai mult de valori sunt împinse pe stivă, cele din partea de jos pur și simplu dispar În loc să indexeze direct registrele, majoritatea instrucțiunilor aritmetice își scot argumentele din stivă, calculează rezultatul și apoi împing rezultatul în stivă În anii , arhitectura stivei era considerată de vârf, deoarece stivele oferă un mecanism simplu pentru calcularea instrucțiunilor aritmetice și permit codificarea instrucțiunilor foarte densă Pe măsură ce tehnologia de compilare s-a îmbunătățit și memoria necesară pentru codificarea programelor nu mai este considerată o resursă critică, aceste calități și-au pierdut importanța anterioară Ar fi mult mai convenabil pentru dezvoltatorii de compilatoare dacă ar avea la dispoziție un set mai mare de registre utilizabile pentru a efectua operații în virgulă mobilă Arhitecturile bazate pe stivă au fost considerate de ultimă generație în anii , deoarece ofereau un mecanism simplu pentru calcularea operațiilor aritmetice, permițând în același timp programele care consumau mult memorie Progresele în tehnologia calculatoarelor, precum și faptul că memoria necesară pentru codificarea programelor nu mai este o resursă critică, aceste avantaje au dispărut în fundal Programatorii în virgulă mobilă ar fi mai confortabili cu un set mai larg de registre în virgulă mobilă Alte limbaje de programare folosind registre Interpreții de stivă sunt folosiți pe scară largă ca intermediari între un limbaj de programare de nivel înalt și maparea acestuia la mașina reală Alte exemple de bloc de calcul intensiv în stivă sunt codurile Java organizate pe octeți și limbajul de formatare a paginii PostScript Dacă registrele în virgulă mobilă sunt organizate ca o stivă de dimensiuni limitate, este dificil pentru compilatori să folosească aceste registre pentru a stoca variabile locale în proceduri care apelează alte proceduri Am văzut deja că la stocarea variabilelor locale întregi, unele registre de uz general pot fi folosite pentru a stoca parametrii procedurii de apelare și, prin urmare, pentru a stoca variabile locale pe durata apelului de procedură Acest tip de utilizare nu este posibil pentru un registru cu virgulă mobilă în arhitectura IA , deoarece identitatea sa se schimbă pe măsură ce datele sunt împinse și scoase din stivă Într-adevăr, operația de push face ca conținutul registrului %st ( ) să devină apoi conținutul registrului %st ( ) Pe de altă parte, uneori este de dorit să se trateze registrele în virgulă mobilă ca registre reale, astfel încât fiecare apel de procedură să-și poată împinge variabilele locale în ele Din păcate, această abordare duce rapid la depășirea lor, deoarece pot deține doar opt valori Pentru a rezolva această problemă, compilatoarele generează un program Partea I Structura și execuția programului cod care salvează fiecare valoare în virgulă mobilă în stiva programului principal înainte de apelarea următoarei proceduri, iar la întoarcerea din această procedură, preia aceste valori din memorie Dar în acest caz, are loc trafic de memorie, care poate degrada performanța programului După cum se arată în sect , registrele cu virgulă mobilă IA conțin de biți fiecare Ele codifică numerele în format de precizie extinsă, vezi ex , Toate numerele cu precizie simplă și dublă sunt convertite în acest format atunci când sunt încărcate din memorie în registre cu virgulă mobilă Operațiile aritmetice sunt întotdeauna efectuate cu dublă precizie Numerele sunt convertite din format de înaltă precizie în format cu precizie simplă sau dublă precizie, în funcție de formatul în care au fost stocate în memorie Evaluarea expresiei folosind stiva Pentru a înțelege modul în care arhitectura IA utilizează registrele pentru a lucra cu numere în virgulă mobilă ca stivă, să ne uităm la calculul stivei la un nivel superior de abstractizare Să presupunem că avem o unitate aritmetică care utilizează o stivă pentru a stoca rezultatele intermediare ale calculelor, cu un set de instrucțiuni prezentate în tabel De exemplu, așa-numita notație RPN (Reverse Polish Notation) folosită în calculatoarele de buzunar are această proprietate Pe lângă această stivă, unitatea aritmetică în cauză are o memorie care poate stoca valori la care ne referim prin nume, cum ar fi a, b și x După cum rezultă din tabel , împingem valorile din memorie pe această stivă cu comanda de încărcare Operația de stocare afișează elementul din partea de sus a stivei și stochează rezultatul în memorie Un operator unar, cum ar fi neg, ia elementul din partea de sus a stivei ca argument și scrie rezultatul în locul său Operațiile binare precum addp și multp iau drept argumente cele două argumente din partea de sus a stivei Ei scot ambele argumente din stivă și apoi împing rezultatul operației înapoi în stivă Folosim sufixul p cu operațiile de stocare, adunare, scădere, înmulțire și împărțire pentru a sublinia faptul că aceste instrucțiuni își scot argumentele din stivă Tabelul Set de instrucțiuni ipotetice folosind stiva Rezultatul execuției comenzii încărcați S Împingeți valoarea de la S pe stivă storep D Scoateți un element din partea de sus a stivei și stocați-l în D neg Luați negația elementului din partea de sus a stivei addp Pop două elemente din partea de sus a stivei; împingeți suma lor pe stivă subp Pop două elemente din partea de sus a stivei; împingeți diferența lor pe stivă Capitolul Reprezentarea programelor la nivel de mașină Tabelul (sfârșit) Rezultatul execuției comenzii multp Pop două elemente din partea de sus a stivei; împingeți produsul lor pe stivă divp Scoate două elemente din partea de sus a stivei; împingeți pe stivă raportul lor Ca exemplu, luați în considerare expresia x = (a-b) / (-b + c) Am putea traduce această expresie în cod de program după cum urmează Împreună cu fiecare linie de cod de program, vom arăta conținutul stivei, construită pe baza unor registre proiectate să funcționeze cu numere în virgulă mobilă Conform convențiilor de mai sus, stiva crește în jos, astfel încât partea de sus a stivei se găsește în partea de jos a diagramei din Fig unu cinci sarcină sarcină neg addp sarcină sarcină subp divp depozitare Orez diagrame de stivă După cum arată acest exemplu, există o procedură recursivă naturală pentru conversia unei expresii aritmetice în coduri de stivă În notația pe care o folosim, sunt folosite patru tipuri de expresii, sub rezerva următoarelor reguli de conversie: □ Referire la o variabilă de forma Var Acest tip de referință este folosit în comanda load Var □ Operare unară a formei -Expr Această operație este implementată după cum urmează: mai întâi, este generat codul pentru Expr, urmat de comanda neg □ Operație binară de forma Ехрг\ + Ехрг , Ехрх - Ехрг , Ехрх * Ехрг sau Ехрг\ / Ехрг Aceste operațiuni sunt implementate prin generarea codului pentru Expr urmat de codul pentru Expr\ și urmat de una dintre comenzile addp, subp, multp sau divp □ Atribuirea formei Var = Expr Această operație este implementată după cum urmează: mai întâi, este generat codul pentru expresia Expr, urmat de operația storep Var Partea I Structura și execuția programului Ca exemplu, luați în considerare expresia x = a-b/c Deoarece împărțirea are prioritate față de scădere, această expresie poate fi inclusă în paranteză astfel: x = a-(b/c) Procedura recursivă corespunzătoare este executată în următoarea secvență: Codul de compilare pentru Expr = a-(b/c) • Construiți codul pentru Expr = b/c: codul pentru Expr = c, folosind comanda load c în acest scop, codul pentru Expr} = b, folosind comanda load b în acest scop, comanda divp • Construiți codul pentru expx=a folosind comanda load a în acest scop • Construiți comanda subp Construiți comanda storep x Acum obținem un program care utilizează stiva după cum urmează (Figura ): încărcare s s %st( ) încărcare ab/c %st(l) a %st( ) încărcați b cu %st( ) b %st ( ) subp a-(b/c) | | %st( ) divp b/c %st( ) storep x Orez Diagrame de stivă de proceduri recursive EXERCIȚIUL Construiți coduri de stivă pentru x = a*b/c ★ - (a+b*c) Desenați o diagramă a conținutului stivei pentru fiecare operație din programul dvs Amintiți-vă să urmați regulile limbajului C care definesc precedența operatorului și proprietatea asociativității Evaluarea expresiilor folosind stiva devine mai complicată dacă dorim să folosim în mod repetat rezultatul anumitor calcule De exemplu, să considerăm expresia x = (a*b) ♦ (-(a*b)+c) Pentru a fi mai eficienți, vom evalua expresia a*b o singură dată, dar instrucțiunile de manipulare a stivei nu ne oferă posibilitatea de a stoca o anumită valoare după ce aceasta a fost folosită Avand la dispozitie comenzile aparute in lista prezentata in Tabel , trebuie să folosim această împrejurare pentru a stoca rezultatul intermediar a*b într-una dintre locațiile de memorie, să spunem t, și pentru a prelua această valoare din memorie ori de câte ori o folosim Obținem următorul cod de program prezentat în Fig Dezavantajul acestei abordări este că este nevoie de a genera trafic suplimentar în memorie, chiar dacă stiva de registre are suficient spațiu pentru a stoca rezultate intermediare Dispozitivele cu virgulă mobilă IA sunt capabile să evite o astfel de utilizare ineficientă a registrelor, Capitolul Reprezentarea programelor la nivel de mașină introducerea unor variante de operații aritmetice care își lasă al doilea operand pe stivă și care pot folosi o valoare arbitrară din stivă ca al doilea operand În plus, este introdusă o comandă care poate înlocui elementul din vârful stivei cu orice alt element din stivă În timp ce aceste expresii pot fi folosite pentru a genera cod mai eficient, algoritmul simplu, dar elegant, pentru conversia expresiilor aritmetice în cod de stivă se va pierde încărcare cu „ c %st( ) încărcare b c %st ( ) b %st( ) încărcare a c %st ( ) b %st( ) a %st( ) multp c %st ( ) a • b %st( ) storep t c , | %st( ) încărcare tc %st ( ) a*b %st( ) neg C %st ( ) - (a • b) %st ( ) addp - (a • b) + c | %st( ) încărcare t -(ab) + c %st ( ) a*b %st( ) multip | ab(-(ab) + c) | %st( ) magazine x Orez Diagrame de stivă de rezultate intermediare Operațiunile de mutare și transformare a datelor Pentru referințe la registrele de date în virgulă mobilă, se folosește notația %st (i), unde i indică poziția relativă la vârful stivei Valoarea lui / poate varia de la la Registrul %st ( ) este elementul din partea de sus a stivei, %st( ) este următorul element și așa mai departe Elementul din partea de sus a stivei poate fi referit prin referința %st Când o nouă valoare este împinsă în stivă, valoarea lui %st( ) se pierde Când o valoare este scoasă din stivă, noua valoare a lui %st( ) nu poate fi prezisă Compilatorii trebuie să genereze cod care funcționează într-o stivă limitată de registre În tabel Figura prezintă setul de instrucțiuni folosit pentru a împinge valori în stiva pentru numere în virgulă mobilă Primul grup al acestor comenzi citește valoarea corespunzătoare din memorie, în timp ce argumentul Addr este adresa de memorie specificată într-unul dintre operanzii stocați în memorie, în formatul prezentat în Tabelul Aceste instrucțiuni diferă prin formatul dorit de operandul original și, prin urmare, prin numărul de octeți care trebuie citiți din memorie Reamintim că notația Mb[Addr] înseamnă acces la o secvență de b octeți începând cu adresa Adr Aceste instrucțiuni convertesc operandul în format de înaltă precizie înainte de a-l împinge pe stivă Comanda finală de încărcare fid este folosită pentru a duplica valoarea de pe stivă Cu alte cuvinte, ea împinge o copie Partea I Structura și execuția programului %st (i) registru în virgulă mobilă în stivă De exemplu, fid %st( ) împinge o copie a elementului din partea de sus a stivei pe stivă Tabelul Comenzi de încărcare în virgulă mobilă Format sursă comandă Adresă sursă flds Addr single M [Addr] fldl Adr double М [Л^г] fldt Addr extins Ml [J =y ar trebui să rezulte ambele în Diferitele forme de instrucțiuni de comparare diferă în locația operandului p , care este tipic pentru diferite forme de instrucțiuni pentru încărcarea valorilor în virgulă mobilă și a operațiunilor aritmetice în virgulă mobilă În cele din urmă, diferitele forme ale acestor comenzi diferă în ceea ce privește numărul de elemente ieșite din stivă după ce comparația este finalizată Comenzile din primul grup, prezentate în tabel, nu fac nicio modificare în stivă Chiar dacă unul dintre argumente este în memorie, valoarea sa nu este împinsă în stivă la sfârșitul execuției comenzii Operațiile celui de-al doilea grup scot un element din stivă Ultima operație scoate ambii operanzi și Op din stivă (Tabelul ) Tabelul Rezultate codificate ale comparației în virgulă mobilă Op,: Op Reprezentare binară Reprezentare zecimală > [ ] ) Octet mic la rezultat, restul la O EXERCIȚIUL Acum, inserând doar o singură linie de cod de asamblare în secvența anterioară, arătați că puteți implementa următoarea funcție: int mai puțin (dublu x, dublu y) { returnează x > y; } Aceasta încheie studiul nostru despre programarea la nivel de asamblator a operațiunilor în virgulă mobilă sub arhitectura IA Chiar și programatorii experimentați găsesc aceste coduri lipsite de vizualizare și greu de citit Operațiile efectuate folosind stiva, pașii greoi de transmitere a datelor de stare de la unitatea în virgulă mobilă (FPU) la procesorul principal și multe alte subtilități ale calculelor în virgulă mobilă, toate împreună, duc la faptul că codurile de mașină corespunzătoare devin prea întinse și obscure Ar trebui notat, Capitolul Reprezentarea programelor la nivel de mașină că dispozitivele moderne cu procesor fabricate de Intel și concurenții săi pot atinge performanțe suficient de ridicate ale programelor numerice Încorporarea codului de asamblare în programele C Într-un stadiu incipient al dezvoltării tehnologiei informatice, majoritatea programelor au fost scrise în coduri de limbaj de asamblare Chiar și sistemele de operare la scară largă au fost scrise atunci fără ajutorul limbajelor de nivel înalt Pentru programele mai mult sau mai puțin complexe, sarcina de a le scrie a devenit de nerezolvat Deoarece nu a existat practic nicio verificare a tipului în codul limbajului de asamblare, a fost foarte ușor să faci greșeli semnificative, cum ar fi folosirea unui pointer ca valoare întreagă în loc să dereferențiezi acel pointer Și mai rău, scrierea în coduri de asamblare condamnă de fapt întregul program să fie executat pe o singură clasă de computere Convertirea programelor scrise în limbaj de asamblare pentru a rula pe un alt tip de mașină necesită în esență același efort ca și scrierea unui program de la zero Scrierea de programe mari în codul de asamblare Frederick Brooks, Jr , unul dintre cei mai timpurii designeri de sisteme informatice, a scris o relatare excelentă a dezvoltării OS/ , unul dintre primele sisteme de operare pentru computere [ ], care încă servește ca o lecție importantă în prezent După un studiu atent al materialului relevant, a devenit un credincios puternic în utilizarea limbajelor de programare de nivel înalt pentru dezvoltarea sistemelor mari În mod ironic, în același timp, există un grup activ de programatori cărora le place să scrie programe pentru mașinile IA în coduri de asamblare Ei comunică între ei prin intermediul grupului de știri comp lang asm x Majoritatea dintre ei dezvoltă jocuri pe calculator pentru sistemul de operare DOS Compilatoarele timpurii pentru limbaje de programare de nivel înalt nu au putut genera cod extrem de eficient și nu au oferit acces la reprezentări de obiecte de nivel scăzut, așa cum le solicită adesea programatorii de sistem Programele care necesită performanță maximă și care necesită acces la reprezentările obiectelor sunt încă scrise în limbaj de asamblare În zilele noastre au apărut însă compilatoare de optimizare care au eliminat optimizarea performanței programului de pe ordinea de zi ca motiv pentru necesitatea scrierii lui în cod de asamblare Codurile de program generate de un compilator de înaltă calitate sunt în general la fel de bune și în multe cazuri superioare codului scris de mână Limbajul C a eliminat aproape complet accesul la mașină ca motiv pentru a scrie programe în codul de asamblare Capacitatea de a accesa reprezentări de date de nivel scăzut prin uniuni și aritmetică pointer, împreună cu capacitatea de a efectua operații la nivel de biți asupra reprezentărilor de date, oferă majorității programatorilor acces suficient Partea I Structura și execuția programului la mașină De exemplu, aproape fiecare parte a unui sistem de operare modern, cum ar fi Linux, este scrisă în C Cu toate acestea, din când în când, există momente când singura cale de ieșire este să scrieți coduri de program în limbaj de asamblare Acest lucru se întâmplă destul de des în implementarea sistemelor de operare De exemplu, există multe registre speciale care stochează informații despre starea proceselor la care sistemul de operare trebuie să aibă acces Există fie comenzi speciale, fie zone speciale de memorie dedicate operațiunilor I/O Chiar și programatorii de aplicații se ocupă de proprietățile mașinii, cum ar fi valorile codului de condiție, care nu pot fi accesate direct dintr-un program C Acest lucru ridică problema integrării într-un cod de program constând în principal din coduri C cu o cantitate mică de cod de program scris în limbaj de asamblare O metodă este să scrieți câteva funcții cheie în codul de asamblare folosind același argument de trecere și de înregistrare a convențiilor pe care le respectă un compilator C Aceste funcții de asamblare sunt stocate într-un fișier separat, iar codul compilat este combinat cu codul de asamblare produce un linker De exemplu, dacă fișierul pi c conține coduri în limbajul C și fișierul p s conține coduri de asamblare, apoi comanda de compilare unix> gcc -o p pl c p s prevede compilarea fișierului pi c și asamblarea fișierului p s cu legarea ulterioară a codului obiect ce formează programul executabil p Asamblator inline de bază Compilatorul GCC oferă posibilitatea de a amesteca codul de asamblare cu codul C Asamblatorul inline permite utilizatorului să insereze codul de limbaj de asamblare direct într-o secvență de cod generată de compilator Sunt furnizate mijloace pentru descrierea operanzilor de instrucțiuni, indicând compilatorului care registre sunt redefinite de instrucțiunile de asamblare Desigur, codul programului rezultat depinde foarte mult de mașină, deoarece diferitele tipuri de mașini nu au instrucțiuni compatibile cu mașina Directiva asm este specifică compilatorului GCC și, din cauza acestei circumstanțe, este incompatibilă cu multe alte compilatoare Cu toate acestea, această abordare poate fi o modalitate utilă de a menține cantitatea de cod specific mașinii la un minim absolut Asamblatorul inline este documentat ca parte a Arhivei de informații GCC Compiler Rularea comenzii info gcc pe orice mașină care are GCC instalat va crea un cititor de documente ierarhic Asamblatorul inline este documentat mai întâi urmând linkul C Extensions și apoi linkul Extended Asm Din păcate, această documentație nu este nici completă, nici exactă Forma de bază a asamblatorului inline necesită să scrieți cod care arată ca un apel de procedură: asm (cod-cmpoKa)\ Capitolul Reprezentarea programelor la nivel de mașină Expresia cod-șir înseamnă o secvență de coduri de asamblare date ca șir cuprins între ghilimele Compilatorul va insera această linie în codul de asamblare generat, astfel încât blocurile legate primite de compilator și furnizate de utilizator vor fi combinate într-o singură unitate Compilatorul nu verifică șirul pentru erori și, prin urmare, primul indiciu că există o problemă este un mesaj de eroare de la asamblator Vom arăta cum este utilizată instrucțiunea asm cu un exemplu în care accesul la codurile de condiție poate fi de mare ajutor Luați în considerare funcțiile cu următoarele prototipuri: int ok smul(int x, int y, int *dest); int ok umul(unsigned x, unsigned y, unsigned *dest); Fiecare dintre aceste funcții este concepută pentru a calcula înmulțirea argumentelor sale x și y, iar rezultatul este stocat în locația de memorie specificată de argumentul deșt Ei returnează ca valoare returnată dacă înmulțirea depășește și dacă nu are loc depășirea Oferim funcții separate pentru înmulțirea cu semn și înmulțirea fără semn, datorită faptului că fiecare dintre ele debordează în circumstanțe diferite Examinând documentația pentru operațiile de multiplicare mul și imul sub arhitectura A , vedem că ambele instrucțiuni setează indicatorul de transport CF (steagul de transport) atunci când au loc depășiri După ce am studiat masa , observăm că comanda setae poate fi folosită pentru a seta octetul scăzut la când acest flag este setat și în caz contrar Astfel, dorim să inserăm această instrucțiune în secvența de coduri generate de compilator În efortul de a minimiza atât cantitatea de cod de asamblare, cât și detaliile analizei, vom încerca să implementăm comanda ok smul cu următorul cod (lista ): I Lista Implementarea comenzii f A ( / dchg - H /* Prima încercare Nu funcționează */ int ok smull(int x, int y, int *dest) { int rezultat = ; cinci *dest = x*y; asm("setae %al"); returnează rezultatul; nouă } Strategia folosită în acest caz folosește faptul că registrul %eax este folosit pentru a stoca valoarea returnată Presupunând că compilatorul folosește acest registru pentru a stoca valorile variabilei rezultat, prima linie este setată la Partea I Structura și execuția programului Setează acest registru la Asamblatorul inline va insera acest cod, care la rândul său stabilește valoarea corespunzătoare a octetului inferior al acestui registru, după care acest registru va fi folosit ca valoare returnată Din păcate, compilatorul GCC are propria idee de a genera coduri de program În loc să seteze registrul %eax la la începutul funcției, codul generat de compilator o face chiar la sfârșitul funcției, astfel încât funcția returnează întotdeauna Problema principală este că compilatorul nu are nicio modalitate de a știind care sunt intențiile programatorului și cum va interacționa ansamblul operator cu restul codului generat de compilator Prin încercare și eroare (o abordare mai sistematică pe care o vom dezvolta), am reușit să construim un cod de lucru, dar acest cod este departe de a fi perfect I Lista Strategia de caz h y ' *' b ? / \ ] I "••••"•••"• •••■••* tril "•"•••(•(••■*•• •«••«»• •»•• : c : push %ebp C : e mov %esp,%ebp c : b mov x (%ebp),%eax с : d ce lea Oxffffffce(%eax),%edx c : fa cmp $ x ,%edx cc: ld ja eb ce: ff jmp * x (,%edx, ) d : cl eO shl $ x ,%eax d : eb jmp ee da: d b lea x (%esi),%esi e : cl f sar $ x ,%eax e : eb jmp ee e : d lea(%eax,%eax, ),%eax e : Of af cO imul %eax,%eax eb: cO a adăugați $ xa,%eax ee: ec mov %ebp,%esp f : d pop %ebp fl: c ret f : f( mov %esi,%esi Suntem interesați în primul rând de partea de cod care este afișată în rândurile - ale acestui cod Pe linia vedem că parametrul x (offset din %ebp) este încărcat în registrul %eax corespunzător variabilei programului rezultat Comanda iea x (%esi), %esi pe linia este o comandă pore introdusă astfel încât comanda de pe linia să înceapă la o adresă care este multiplu de Tabelul de sărituri este conținut într-o altă zonă de memorie Folosind depanatorul GDB, putem inspecta șase cuvinte de memorie de octeți, începând cu adresa x , unde se află comanda x/ w x Depanatorul GDB tipărește următorul text: (gdb)x/ w x : x : x x d x e x eb x d x e x e (gdb) Completați corpul instrucțiunii select cu cod C care oferă același comportament ca și codul obiect Capitolul Reprezentarea programelor la nivel de mașină EXERCIȚIUL ♦ ♦ Codul generat de compilatorul C pentru var prod ele (vezi Lista - ) nu este optim Codați această funcție pe baza procedurilor hibride fix prod ele opt (vezi Lista - ) și var jprod ele opt (vezi Lista - ) Vă reamintim că procesorul are doar șase registre disponibile pentru stocarea datelor temporare, deoarece registrele %ebp și %esp nu pot fi folosite în acest scop Unul dintre aceste registre trebuie folosit pentru a stoca rezultatul instrucțiunii de multiplicare Prin urmare, trebuie să reduceți numărul de variabile locale din buclă de la șase (rezultat, Aptr, at, nTjPk, n și cnt) la cinci EXERCIȚII ♦ ♦ Sarcina ta este să menții un program C mare și ai dat peste următorul cod: typedef struct { int stânga; a struct a[CNT]; int dreapta; } b struct; test void(int i, b struct *bp) opt { int n = bp->stânga + bp->dreapta; a struct *ap = &bp->a[i]; ap->x[ap->idx] = n; } Din păcate, fișierul h care definește constanta statică cnt și structura a sunt stocate în fișiere la care nu aveți acces privilegiat În același timp, aveți acces la versiunea o a codului, pe care o puteți asambla invers folosind programul objdump, rezultând următorul cod dezasamblat: : împinge %ebp : e mov %esp,%ebp : împinge %ebx : b mov x (%ebp), %eax : b d c mov Oxc(%ebp),%ecx a: d lea (%eax,%eax, ),%eax d: d lea x (%ecx,%eax, ),%eax : b mov (%eax),%edx : cl e shl $ x ,%edx Partea I Structura și execuția programului : b b mov xb (%ecx),%ebx lc: adaugă (%ecx),%ebx le: c mov %ebx, x (%edx,%eax, ) : b pop %ebx : ec mov %ebp,%esp : d pop %ebp : c ret Folosindu-vă abilitățile de restaurator de cod sursă, identificați următoarele elemente de program: □ valoarea CNT; □ declararea completă a structurii a struct Aceasta presupune că această structură conține doar două câmpuri - idx și x exercitiul ♦ Scrieți o funcție good echo care citește un șir din intrarea standard și îl scrie în ieșirea standard Programul dvs trebuie să funcționeze cu un șir de lungime arbitrară Puteți utiliza funcția de bibliotecă fgets, dar, în primul rând, trebuie să vă asigurați că funcția dumneavoastră funcționează corect chiar și atunci când șirul de intrare necesită mai mult spațiu de memorie decât ați alocat pentru buffer Programul dvs trebuie, de asemenea, să detecteze și să raporteze condițiile de eroare, dacă există Dacă este necesar, ar trebui să vă referiți la definițiile funcțiilor standard I/O conținute în documente [ , ] EXERCIȚIUL ♦ ♦ ♦ Conform termenilor acestei probleme, trebuie să simulați un atac al unui atacator cu o depășire a tamponului în programul dumneavoastră După cum sa menționat mai sus, nu putem tolera utilizarea acestei forme sau a altor forme de atac asupra sistemului pentru a obține acces neautorizat la sistem, dar veți învăța multe despre programarea la nivel de mașină în cursul acestui exercițiu În fișierul bufbomb c, definiți următoarea funcție: int getbuf() { charbuf[ ]; getxs(buf); întoarce ; } test nul() nouă { valoare int; printf("Type Hex string:"); Capitolul Reprezentarea programelor la nivel de mașină val = getbuf(); printf("getbuf a returnat Ox%x\n", val); paisprezece } Funcția getxs (și în bufbomb c) este similară cu funcția de bibliotecă gets, cu excepția faptului că citește caractere codificate ca perechi de cifre hexazecimale De exemplu, pentru a-i trece șirul utilizatorul trebuie să introducă un șir de la tastatură Această funcție ignoră spațiile albe Amintiți-vă că cifrele zecimale au o reprezentare ASCII de x x Acest program este de obicei rulat astfel: unix> /bufbomb Tip șir hexagonal: getbuf a returnat x Chiar și o examinare superficială a funcției getbuf arată că returnează valoarea ori de câte ori este apelată Rezultă că apelarea funcției getxs este inutilă Sarcina dvs este ca funcția getbuf să returneze - (Oxdeadbeef) la comanda de testare, tastând șirul hexazecimal corespunzător la prompt Următoarele ipoteze vă pot ajuta să rezolvați această problemă □ Utilizați programul objdump pentru a construi o versiune dezasamblată a funcției bufbomb Studiați cu atenție această versiune pentru a determina cum este organizat cadrul stivei funcției getbuf, cum se va schimba starea salvată a programului ca urmare a depășirii tamponului □ Rulați programul în depanatorul GDB Setați un punct de întrerupere în funcția getbuf și executați până la acel punct de întrerupere Specificați parametri precum valoarea din registrul %ebp și valoarea stocată a oricărei stări care va fi suprascrisă atunci când provocați o depășire a tamponului □ Determinarea manuală a codificării octeților a secvențelor de instrucțiuni este greoaie și poate cauza erori Puteți lăsa această muncă pe seama instrumentelor, pentru care creați un fișier de cod de asamblare și datele pe care doriți să le puneți în stivă Asamblați acest fișier cu compilatorul GCC și apoi dezasamblați-l cu programul objdump Ar trebui să puteți obține secvența exactă de octeți pe care o introduceți de la tastatură la solicitare Programul objdump generează un set destul de ciudat de instrucțiuni de asamblare atunci când încearcă să dezasamblați datele din fișierul dvs , dar secvența de octeți hexazecimali trebuie să fie corectă Partea I Structura și execuția programului Rețineți că atacul dvs este foarte specific pentru mașini și compilator Este posibil să fie nevoie să schimbați linia când rulați pe o altă mașină sau cu o versiune diferită a compilatorului EXERCIȚIUL ♦ ♦ ♦ Utilizați operatorul asm când implementați o funcție care are un prototip: void full umul(unsigned x, unsigned y, unsigned dest[]); Această funcție trebuie să calculeze produsul complet de de biți al argumentelor sale și să stocheze rezultatele în matricea de destinație, cu dest[ ] stocând cei octeți inferiori ai produsului și deșt[ ] păstrând cei octeți mari EXERCIȚIUL ♦ Comanda fscale calculează funcția x - R (^) pentru valorile în virgulă mobilă x și y, unde RTZ (rotunzi spre zero) înseamnă rotunjirea numerelor pozitive în jos și a numerelor negative în sus Argumentele pentru fscaie sunt preluate din stiva de registre în virgulă mobilă, x în %st( ) și y în %st( ) Acesta scrie valoarea calculată în registrul %st( ) fără a scoate al doilea argument din stivă Implementarea efectivă a acestei comenzi funcționează ca adăugarea RTZ(y) la exponentul valorii x Folosind asm, implementați o funcție cu următorul prototip: scară dublă (x dublu, int n, dublu *dest); care calculează x- n folosind comanda fscaie și stochează rezultatul în celula indicată de pointerul deșt Declarația asm extinsă nu oferă suport de încredere pentru arhitectura IA în virgulă mobilă Cu toate acestea, în acest caz, puteți accesa argumente din stiva programului Soluție de exercițiu EXERCIȚIU DE SOLUȚIE Acest exercițiu vă oferă oportunitatea de a învăța cum să lucrați cu diferite tipuri de operanzi Operand Valoare Comentariu Înregistrare %eax x x Ohav Adresă absolută $ x x Imediat (%eax) Adresa OxFF x (%eax) Adresă Ox x Capitolul Reprezentarea programelor la nivel de mașină (final) Operand Valoare Comentariu (%ex,%edx) x Adresă x SUA (%ex,%edx) x Adresa x OxFC(,%ex, ) Adresa OxFF x (%ex,%edx, ) x Adresă x SUA SOLUȚIA Ingineria inversă este o modalitate bună de a obține înțelegerea sistemului În acest caz, facem opusul a ceea ce face compilatorul C pentru a ști care este sursa codului de limbaj de asamblare dat Cel mai bun mod de a face „simularea” este să începeți cu valorile x, y și z din celulele definite de xp, yp și, respectiv, zp În acest caz, obținem următorul comportament: movl (%ebp),%edi xp movl (%ebp)f%ebx ur movl (%ebp),%esi zp movl(%edi),%eax X movl (%ebx)t %edx movl(%esi), %ecxz movl %eax,(%ebx) *UR = X movl %edx,(%esi) *zp = Y movl %ecx,(%edi) *xp = z Pe baza acestui fragment, putem obține următorul cod C: decodificare void (int *xp, int *ur, int *zp) { int tx = *xp; int ty = *yp; int tz = *zp; *yp=tx; ♦zp = ty; ♦xp = tz; } SOLUȚIA PENTRU EXERCIȚIUL Acest exercițiu arată cât de versatilă este comanda leal și vă permite să vă familiarizați cu decodarea operanzilor de formă Notă Partea I Structura și execuția programului că, deși formele operanzilor sunt clasificate ca tip de memorie în Fig , nu are loc acces la memorie Expresie Rezultat leal (%eax), %edx +x leal(%eax,%exx), %edx x+y leal(%ex,%ex, ), %edx x+ y leal (%eax,%eax, ), %edx + x leal xA(,%ex, ), %edx + y leal (%ex,%ex, ), %edx +l+ y SOLUȚIE ȘI EXERCIȚII Această sarcină vă oferă șansa de a vă testa înțelegerea operanzilor și a instrucțiunilor aritmetice Comandă Scop Sensul addl %ex,(%eax) x x subl %edx, (%eax) x xA imull $ ,(%ex,%edx, ) OxlOC x inel (%eax) x x deci %ecx %ecx x subl %edx,%eax %eax OxFD SOLUȚIA EXERCITULUI Acest exercițiu vă oferă posibilitatea de a construi o mică bucată de cod în limbaj de asamblare Codul soluției este generat de compilatorul GCC După ce a încărcat parametrul n în registrul %esx, apoi folosește registrul de octeți %cі pentru a seta valoarea de deplasare a comenzii sari: movl (%ebp),%ecx Obțineți n movl (%ebp),%eax Obțineți X vinde $ ,%eax x "= sari %cl,%eax x "= n EXERCIȚII DE SOLUȚIE Această instrucțiune este folosită pentru a seta registrul %edx la folosind proprietatea că x L x = pentru orice x Ea corespunde operatorului i = Capitolul Reprezentarea programelor la nivel de mașină Acesta este un exemplu de limbaj de asamblare - o bucată de cod care este adesea generată în scopuri speciale Recunoașterea acestor expresii este una dintre cele mai bune modalități de a învăța cum să citiți codul de asamblare SOLUȚIA EXERCITULUI Acest exemplu necesită să luați în considerare utilizarea diferitelor comenzi de comparare O atenție deosebită trebuie acordată faptului că atunci când una dintre valorile operatorului de comparație este convertită în valori fără semn, operația de comparare se efectuează ca și cum ambele valori comparate ar fi valori nesemnate, din cauza turnării implicite a tipului test de caractere (int a, int b, int c) { char tl = a = (scurt) a; char t = (char) a != (char) c; char t = c > b; char t = a > ; întoarcere tl + t + t + t + t + t ; } SOLUȚIE/ EXERCIȚIU Acest exercițiu necesită să faceți o analiză detaliată a codului dezasamblat și să vă gândiți la modul în care este codificată destinația instrucțiunii de salt Procedând astfel, vă puteți îmbunătăți abilitățile de aritmetică hexazecimală Comanda jbe are ca țintă adresa x dic + Oxda După cum arată codul sursă dezasamblat, acesta este x cf dlc: da jbe cf dle: eb jmp d Conform comentariului pe care dezasamblatorul l-a dat codurilor sale, destinația instrucțiunii de salt este adresa absolută x d Din codurile de octeți rezultă că aceasta ar trebui să fie o adresă cu un offset de x de octeți în raport cu instrucțiunea mov Scăzând unul din celălalt, obținem adresa x cf , care este confirmată de codul de dezasamblare: vezi: eb jmp d O cfO: c f mov $ x ,Oxffffffff (%ebp) Adresa de destinație este deplasată cu oooooocb în raport cu celula x (adresa comenzii pore) Suma acestor valori dă adresa x d : e cb jmp d : pori Partea I Structura și execuția programului Funcționarea unei ramuri indirecte este indicată de codul ff Adresa de la care se efectuează citirea este definită în mod explicit în următorii octeți Deoarece ordinea inversă este implementată în mașina luată în considerare, avem secvența e a f : ff eo a jmp * x a e f : EXERCIȚII DE SOLUȚIE Un pas inițial util în învățarea unui program în limbaj de asamblare este să comentați programul și să modelați fluxul de control al acestuia în C Această sarcină vă va permite să vă familiarizați cu exemple de fluxuri de control simple De asemenea, vă va oferi oportunitatea de a învăța cum să implementați diverse operații logice void cond(int a, int *p) { dacă (P == ) am terminat; dacă (a o este omis în codul în cauză EXERCIȚII DE SOLUȚIE Codul generat de compilatorul pentru bucle poate fi dificil de analizat, deoarece compilatorul poate efectua multe optimizări ale codului care implementează buclele și devine dificilă maparea variabilelor programului la registre Vom începe să dobândim abilitățile adecvate prin învățarea ciclurilor simple Modul în care este utilizat registrul poate fi determinat prin analizarea modului în care sunt preluate argumentele Utilizarea registrelor Valoarea inițială a variabilei de înregistrare %esi XX %ebx Y Y %ecxnn Capitolul Reprezentarea programelor la nivel de mașină Partea din codul programului care reprezintă body-onepamop (loop body) este cuprinsă în rândurile până la din programul Civ, rândurile până la din codul limbajului de asamblare O parte din codurile care implementează test-expr (condiția de continuare a buclei) este conținută în linia a codului programului C În codurile limbajului de asamblare, această condiție este implementată de instrucțiunile conținute în rândurile - , precum și de condiția de săritură cuprinsă în rândul Codul, prevăzut cu comentarii, are următoarea formă: movl (%ebp), %esi Pune x în %esi movl (%ebp),%ebx Pune y în %ebx movl (%ebp),%ecx Plasați n în %ecx p align ,, L :buclă: imull %ecx,%ebx y *= n addl %ecx,%esi X += n deci %ecx n— testl %ecx,%ecx Testarea valorii lui n setg %aln > cmpl %ecx,%ebx Compara y:n setl %dl y ) și (y ) și (y = ; i = ix) { rezultat += y * x; } returnează rezultatul; nouă } SOLUȚII ȘI EXERCIȚII E Această sarcină vă oferă oportunitatea de a analiza fluxul de control al unei instrucțiuni select Pentru a răspunde la întrebări, va trebui să selectați informațiile de care aveți nevoie din mai multe locuri din codul de asamblare În rândul al codului de asamblare, și x sunt adăugate astfel încât limita inferioară a intervalului de cazuri să fie Aceasta înseamnă că eticheta minimă a cazului este - Liniile și trec la majusculele implicite dacă valoarea redusă a majusculelor este mai mare de Rezultă că eticheta maximă a cazului este - + = Din tabelul de salt, vedem că a doua apariție (eticheta cazului - ) are aceeași destinație ( o) ca și comanda de salt de pe linia , indicând cazul de comportament implicit Prin urmare, eticheta cazului - lipsește din corpul declarației Din tabelul de sărituri, vedem că a cincea și a șasea apariție au același scop Aceasta corespunde etichetelor de caz și Partea I Structura și execuția programului Luând în considerare toate aceste considerente, ajungem la două concluzii: □ Etichetele de caz din corpul unei instrucțiuni select au valorile - , , , , și □ Cazurile alocate L sunt etichetate cu și EXERCIȚII DE SOLUȚIE Acesta este un alt exemplu de idiomuri în limbaj de asamblare La început pare destul de ciudat: o comandă caii pentru care nu există o comandă ret corespunzătoare Apoi, în cele din urmă, ne dăm seama că acesta nu este deloc un apel de procedură Adresa comenzii popi este setată în registrul %eax Aceasta nu este o subrutină adevărată, deoarece fluxul de control este în aceeași ordine ca și comenzile, iar adresa de retur este scoasă din stivă În arhitectura IA , aceasta este singura modalitate de a pune valoarea contorului programului într-un registru întreg EXERCIȚIUL DE SOLUȚIE Această sarcină aduce concretețe în discuția despre convențiile de registru Registrele %edi, %esi și %ebx stochează datele procedurii apelate Procedura trebuie să le salveze pe stivă înainte de a le schimba valorile și să le restabilească înainte de a reveni la procedura de apelare Celelalte trei registre stochează informațiile procedurii de apelare Ele pot fi modificate fără a afecta comportamentul procedurii de apelare SOLUȚIA EXERCITULUI Capacitatea de a determina modul în care funcțiile folosesc stiva este foarte importantă pentru înțelegerea codului construit de compilator După cum arată acest exemplu, compilatorul rezervă o cantitate mare de memorie care nu este niciodată folosită Începem prin a pune valoarea x în registrul %esp Linia decrește această valoare cu , rezultând , iar aceasta devine noua valoare a registrului %ebp Putem vedea cum cele două comenzi leal evaluează argumentele, care sunt apoi transmise comenzii scanf Deoarece argumentele sunt împinse în ordine inversă, putem vedea că variabila x este compensată cu - din %ebp și variabila y este compensată cu - Prin urmare, adresele sunt x ȘI x Pornind de la valoarea inițială de x , linia decrește indicatorul stivei cu Linia îl decrește cu , iar linia îl decrește cu Trei operații de împingere îl micșorează cu , cu o modificare totală de Prin urmare , după linia , conținutul registrului %esp este x Capitolul , Reprezentarea programelor la nivel de mașină Cadrul stivă are următoarea structură și conținut: x c x %ebp x x X x x Y x x C x x x x c x x x x x %esp Adresele de octet de la x la x nu sunt utilizate DECIZIE Acest exercițiu vă testează înțelegerea lucrurilor precum dimensiunile datelor și indexarea matricei Rețineți că un pointer către orice tip de date necesită octeți de memorie Compilatorul GCC alocă octeți de memorie pentru fiecare dublu lung, chiar și în cazurile în care formatul real necesită doar octeți Array Dimensiunea elementului Dimensiunea totală Adresa de început Element / S * xs + / t Xm xr+ i și Chi Chi + i V Hu Hu + / W Xțy Xw + / EXERCIȚII DE SOLUȚIE Această problemă este o variantă a problemei matricei întregi e Este important să fii conștient de diferența dintre un pointer și obiectul către care indică Deoarece tipul de date scurt necesită doi octeți, toți indecșii sunt scalați cu un factor de doi În loc să folosim comanda movl ca înainte, aici folosim comanda movw Partea I Structura și execuția programului Expresie Tip Valoare Cod limbaj de asamblare S+l scurt * xs + leal (%edx),%eax S [ ] scurt M[xL + ] movw (%edx),%ax &s [i] scurt * xs + i leal (%edx,%ecx, ),%eax S[ *i+ ] scurt M[xv + / - ] movw (%edx,%ecx, ),%ax S+i- scurt * x$ + i- leal - (%edx,%ecx, ),%eax EXERCIȚII DE SOLUȚIE Această operațiune necesită aplicarea corectă a operațiunilor de scalare atunci când calculați adrese și o formulă de indexare pentru a calcula indicele de început al unui rând Primul pas este să comentați codul de asamblare pentru a determina cum ar trebui să fie calculate referințele adresei: movl (%ebp),%ecx Obțineți i movl (%ebp),%eax Obține j leal (,%eax, ),%ebx *j leal (,%ecx, ),%edx *i subl %ecx,%edx *i addl %ebx,%eax *j vând $ ,%eax *j movl mat (%eax,%ecx, ),%eax mat [( *j + *i)/ ] addl matl(%ebx,%edx, ),%eax +matl[( *j + *i)/ ] De aici putem vedea că referința matricei matl este offset-ul ( / + j) în octeți, în timp ce referința matricei mat este offset-ul ( y + /) în octeți De aici putem determina că matricea matl are coloane în timp ce matricea mat are coloane Prin urmare, M = și N = SOLUȚIE ȘI EXERCIȚIU Acest exercițiu necesită să aveți o bună cunoaștere a codului de asamblare pentru a înțelege cum este optimizat Aceasta este o abilitate foarte importantă pentru a îmbunătăți performanța programului Făcând modificări adecvate codului sursă, puteți obține performanțe apropiate de cea a codului construit de mașină Iată o versiune optimizată a codului C: /* Setați toate elementele diagonale la val */ void fix set diag opt (fix matrix A, int val) { int *Aptr = &A[ ][ ] + ; int cnt = N- ; face { Capitolul Reprezentarea programelor la nivel de mașină *Apptr = val; Aptr -= (N - ); cnt—; } în timp ce (cnt >= ); ȘI } Cum se leagă de codul de asamblare poate fi văzut din următoarele comentarii: movl (%ebp),%edx movl (%ebp),%eax movl $ ,% ex addl $ ,%eax p align ,, L : movl %edx,(%eax) addl $- ,%eax deci %ecx jns L obține val Obtine o i = Aptr = &A[ ][ ] + / buclă: *aptr = val Aptr -= / eu— dacă i >= merg la buclă Rețineți că programul de cod de asamblare începe la sfârșitul matricei și avansează la început Decrementează valoarea indicatorului cu (= x ) deoarece elementele matricei a[i- ] [i- ] și A[i] [i] sunt separate între ele prin N+ elemente SOLUȚIA EXERCITULUI Această sarcină vă obligă să acordați o atenție deosebită topologiei structurii și codurilor utilizate pentru accesarea câmpurilor structurii Declarația de structură este o variantă a exemplului dat în text Acesta arată că construcția structurilor imbricate se realizează prin încorporarea structurilor interioare în structurile exterioare Topologia structurii este următoarea: Offset Continut p SX sy în continuare Folosește octeți Ca întotdeauna, începem prin a furniza codului programului un comentariu: movl (%ebp),%eax Take sp movl (%eax),%edx Obține sp->sy movl %edx, (%eax) Copiați în sp->sx leal (%eax),%edx Obține &(sp->sx) movl %edx,(%eax) Copiați în sp->p movl %eax, (%eax) sp->next = p Partea I Structura și execuția programului Pe baza acestui cod de asamblare, obținem următorul cod C: void sp init(struct prob *sp) { sp->sx = sp->sy; sp->p = &(sp->sx); sp->next = sp; SOLUȚIA E EXERCIȚIUL EH J Aceasta este o problemă destul de dificilă Pentru a o rezolva, este necesară o ingeniozitate specială atunci când se rezolvă probleme de inginerie inversă Arată clar că uniunile sunt cel mai simplu mod de a asocia mai multe nume (și tipuri) cu aceeași locație de memorie Topologia federației este prezentată în tabelul următor După cum reiese din acest tabel, această uniune poate avea propria interpretare el (prezența câmpurilor ei p și ei y), propria interpretare e (prezența câmpurilor e x și e next) Offset Conținut el p ei y e x e următorul d Folosește octeți Această asociere poate avea propria interpretare a unor instrucțiuni țiuni movl (%ebp),%eax movl (%eax),%edx movl(%edx),%ecx movl(%eax),%eax movl(%ecx),%ecx subl %eax,%ecx movl %ecx, (%edx) Ia-l ip->e y (prin) sau sus->e next sus->e next->el p sau sus->e next->e x (nu) sus->el p (nu) sau sus->e x *(sus->e next->el p) ★(sus->e next->el p) - sus->e x Salvați în sus->e next->el y Pe baza acestui cod, putem scrie următorul program C: void proc(union ele *up) { sus->e next->el y = *(sus->e next->el p) - sus->e x; } SOLUȚIA E EXERCIȚIUL NIIIIIIA Reprezentarea corectă a topologiei și alinierii structurilor este foarte importantă pentru înțelegerea câtă memorie este necesară pentru a găzdui un anumit Capitolul Reprezentarea programelor la nivel de mașină o structură diferită, precum și ce coduri care oferă acces la structuri, le generează compilatorul Această problemă vă permite să dezvoltați corect toate detaliile pentru aceste sau alte exemple de structuri struct PI { int i; char c; int j; mătgul; }; i s jd Total Alignment struct P { int i; char c; mătgul; int j; }; eu cu dj Total Alignment struct P { scurt w[ ]; char c[ ] }; W cu aliniere totală struct P { short w[ ]; char *c[ ] }; W cu aliniere totală struct P { struct PI a [ ]; struct P *p }; a R Alinierea totală SOLUȚII ȘI EXERCIȚII Această sarcină acoperă o gamă largă de subiecte, cum ar fi cadre de stivă, reprezentări șiruri, coduri ASCII și ordonarea octeților Demonstrează pericolele referințelor în afara limitelor și efectele dăunătoare ale depășirilor de buffer Partea I Structura și execuția programului Stivuiți pe linia : Adresa de retur bf ff fe Salvat %ebp Capitolul Arhitectura procesorului Am implementat un simulator de set de comenzi numit yis Când este executat pe un cod obiect personalizat, este generată următoarea ieșire (Listing ): |gLi ! Prezice PC wjcode W valM Creștere PC Selectați predPC t Orez , Selectarea contorului de instrucțiuni PIPE și logica de preluare Logica de selecție a PC-ului selectează din trei surse de contor de programe De îndată ce ramura estimată greșit intră în stadiul de memorie, valoarea vaIP pentru acea instrucțiune (indicând adresa următoarei instrucțiuni) este citită din registrul conductei M (semnal MvaIA) Când instrucțiunea ret intră în etapa de scriere inversă (Listarea - ), adresa de retur este citită din registrul conductei W (semnal W valM) Toate celelalte cazuri folosesc valoarea contorului de program prezisă stocată în registrul conductei F (semnal F predPC) Lista Predicția contravalorii int f pc = [ # Ramura estimată greșit Eșantionare la PC incrementat M icode = = IJXX && !M Bch : M valA; # Finalizarea comenzii RET W icode == IRET : W valM; # Implicit: Folosiți valoarea estimată pentru PC : F predPC; ]; Logica de selecție PC selectează valC pentru instrucțiunea selectată atunci când este fie o invocare, fie un salt, iar vaIP în caz contrar: Capitolul Arhitectura procesorului int new F predPC = [ f icode în { IJXX, ICALL } : f valC; : f valP; Blocurile logice etichetate „Instr valid”, „Need regids” și „Need valC” sunt aceleași ca pentru SEQ, cu semnalele originale numite corespunzător Etapele decodării și scrierii înapoi Pe fig Figura detaliază logica de decodare și writeback a PIPE Blocurile etichetate „dstE”, „dstM”, „scrA” și „scrB” sunt foarte asemănătoare în implementarea SEQ Rețineți că ID-urile de registru transmise la porturile de scriere provin din etapa de scriere inversă (semnalele W dstE și W dstM) și nu din etapa de decodare Acest lucru se datorează faptului că scrierea trebuie să fie în registrele de ieșire desemnate de comandă în timpul fazei de rescriere E dstE Orez , Decodificarea PIPE și logica pașilor de feedback Partea / Structura și execuția programului Pe fig În Figura , niciuna dintre instrucțiuni nu necesită vaIP și o valoare citită din portul registrului A, astfel încât acestea pot fi combinate pentru a forma un semnal vaIA pentru pașii următori Blocul etichetat „Sel+Fwd A” îndeplinește această sarcină și, de asemenea, implementează logica de transfer pentru operandul haIA sursă Blocul etichetat „Fwd B” implementează logica de transfer pentru operandul haIB sursă Locațiile de scriere a registrului sunt indicate de semnalele dstA și dstB din etapa de feedback, nu din etapa de decodare, deoarece rezultatele instrucțiunii aflate în prezent în etapa de scriere înapoi sunt în curs de scriere exercițiul Blocul desemnat „dstE” la etapa de decodare generează semnalul dstE cu același nume pe baza câmpurilor comenzii selectate în registrul conductei D În descrierea PIPE HCL, semnalul rezultat se numește new E dstE Scrieți codul pentru acest semnal pe baza descrierea HCL a semnalului dstE SEQ (vezi descrierea etapei de decodificare din Secțiunea ) Cea mai mare parte a complexității acestei etape este legată de logica de transmitere (promovare) După cum am menționat deja, blocul etichetat „Sel Fwd A” îndeplinește două roluri Combină semnalul vaIP cu semnalul vaIA din etapele ulterioare pentru a reduce cantitatea de stare din registrul conductei De asemenea, implementează logica de transmisie a operandului sursă haIA Combinarea semnalelor vaIA și vaIP profită de faptul că doar instrucțiunile caii și jump necesită valoarea vaIP în pașii ulterioare, iar aceste instrucțiuni nu necesită o valoare citită din portul A al fișierului de registru Această selecție este controlată de semnalul icode pentru acel pas Când semnalul D icode se potrivește cu codul comenzii caii sau jxx, atunci acest bloc va selecta D valP ca ieșire După cum sa menționat în Secțiunea , există cinci surse de transmisie diferite, fiecare cu un cuvânt de date și un identificator de registru de ieșire (Tabelul ) Tabelul Surse de transmitere Cuvânt de date Identificator de registru Descrierea sursei e va!E E dstE Ieșire ALU m valM MdstM Memory Out M valE MdstE Scriere suspendată pe portul E în stadiul de memorie W valM W dstM Scrierea suspendată pe portul M în timpul fazei de rescriere WvalE W dstE Scriere suspendată pe portul E în timpul fazei de rescriere Capitolul Arhitectura procesorului Dacă niciuna dintre condițiile de mutare nu este îndeplinită, atunci blocul trebuie să selecteze d rvalA, valoarea citită din portul de registru A ca ieșire Punând totul cap la cap, avem descrierea HCL a noii valori vaIA pentru registrul conductei E în Listarea Lista Noua valoare a registrului conductei / r^ int new E valA = [ D icode în { ICALL, IJXX } : D valP;# Utilizați computerul incrementat d scrA = = E dstE:e valE;# Mutați valE din timpul de rulare d scrA = = M dstM:m valM; # Mutați valM din stadiul de memorie d scrA = = M dstE:M valE;# Mută valE din memorie d scrA = = W dstM:W valM; # Mutați valM din stadiul de rescriere d scrA == W dstE:W valE; # Mutați valE din writeback l:d rvalA;# Utilizați valoarea citită din fișierul de registru ]; Prioritatea setată pentru cele cinci surse de transmisie din codul HCL de listare este foarte importantă Această prioritate este determinată în codul HCL de ordinea în care sunt testați cei cinci identificatori ai registrului de ieșire Dacă alegeți o altă ordine decât cea specificată, pentru unele programe comportamentul conductei va fi incorect Pe fig Figura prezintă un exemplu de program care necesită setarea corectă a priorității între sursele de transmisie în etapele de execuție și stocare În acest program, primele două instrucțiuni scriu în registrul %edx, iar a treia folosește acest registru ca operand sursă Când instrucțiunea gppoi ajunge la etapa de decodare din ciclul , logica de transmisie trebuie să aleagă una dintre cele două valori destinate registrului său sursă Ce valoare sa alegi? Pentru a seta prioritatea, luați în considerare comportamentul unui program în limbajul mașină atunci când execută o comandă la un moment dat Primul irmovl va seta registrul %edx la , al doilea va seta acel registru la , iar apoi comanda rmovl va citi %edx din Pentru a modela acest comportament, o anumită implementare pipeline ar trebui să seteze întotdeauna prioritatea sursei de transmisie la cea mai timpurie etapă în conductă, deoarece în ea conține cea mai recentă instrucțiune din secvența de formare a registrului Astfel, logica din Listatul - testează mai întâi sursa de trimitere în timpul rulării, apoi în timpul memoriei și în sfârșit la writeback Prioritatea de transfer între două surse în fazele de memorie sau feedback este relevantă doar pentru instrucțiunea popi %esp, deoarece numai această instrucțiune poate scrie în două registre în același timp Pe fig În Figura - , în Bucla , valorile pentru %edx sunt disponibile atât din faza de rulare, cât și din faza de memorie Logica de trecere trebuie să aleagă una dintre valorile în timpul rulării, deoarece aceasta din urmă reprezintă cea mai recentă valoare generată pentru registrul dat Partea / Structura și execuția programului # rgob x : irmovi $ ,%edx FDEMW x : irmovi $ ,%edx FDEMW OxOOc: rrmovl %edx,%eax FDEMW x e: opriți FDEM w Ciclul Orez , Demonstrație de prioritate a mișcării Să presupunem că ordinea pentru al treilea și al patrulea caz (două surse de trecere din stadiul de memorie) în codul HCL pentru noul E valA este inversată Descrieți comportamentul rezultat al comenzii rrmovl (linia ) pentru următorul program: irmovi $ , %edx irmovi $ x , %esp rmmovl %edx, (%esp) popi%esp rrmovl %esp, %eax Pentru EH ȘI E , Să presupunem că ordinea pentru cel de-al cincilea și al șaselea caz (cele două surse de transmisie din etapa de rescriere) din codul HCL pentru new E valA este inversată Scrieți un program Y care nu ar rula corect Descrieți cum apare eroarea și cum afectează comportamentul programului Y E t I E Scrieți codul HCL pentru semnalul new E valB, furnizând valoarea pentru operandul vaIB inițial trecut în registrul conductei E Capitolul Arhitectura procesorului Timp de rulare Pe fig Figura arată logica de rulare pentru PIPE Dispozitivele hardware și blocurile logice sunt aceleași ca pentru SEQ, cu redenumirea corespunzătoare a semnalelor Se poate observa că semnalele e vaIE și E dstE sunt direcționate către etapa de decodare Această parte a proiectului este foarte asemănătoare cu logica implementării SEQ Orez , Logica de rulare PIPE e vaIE E dstE stadiul memoriei Pe fig Figura prezintă logica etapei de memorie pentru PIPE Dacă îl comparăm cu stadiul de memorie pentru SEQ (vezi Figura ), veți observa că blocul etichetat „Date” din wjcode M Bch MJcode W dstE V\TdstM m valM M d tE M dstM M-valA M-ValE Orez , Logica de etapă a memoriei PIPE W valE WvalM Partea I Structura și execuția programului SEQ, nu este prezentă în PIPE Acest bloc a servit la selectarea valorilor surselor de date vaIP (pentru comenzile caii) și vaIA, totuși, în etapa de decodare, această alegere nu se face prin blocul marcat „Sel+Fwd A” Toate celelalte blocuri de la această etapă, ca în SEQ, cu redenumirea corespunzătoare Această diagramă arată, de asemenea, că multe dintre valorile din registrele conductei, precum și M și W, sunt transferate în alte părți ale lanțului ca parte a logicii și controlului de transfer logica conductei Logica de control al conductei Acum suntem gata să finalizăm proiectul PIPE prin crearea logicii de control al conductei Această logică ar trebui să gestioneze următoarele trei cazuri de control, pentru care alte mecanisme sunt insuficiente (mișcarea datelor și predicția ramurilor): □ Procesare ret Conducta ar trebui să se oprească când comanda ret ajunge la etapa de feedback □ Riscuri de descărcare și utilizare Conducta trebuie să se oprească pentru un ciclu între o instrucțiune care citește o valoare din memorie și o instrucțiune care utilizează acea valoare □ Ramuri prezise incorect În momentul în care logica de ramificare detectează că ramificația nu trebuie executată, mai multe instrucțiuni privind ținta ramificației vor începe să traverseze conducta Aceste comenzi trebuie eliminate din conductă În primul rând, vor fi efectuate toate acțiunile necesare pentru un anumit caz, după care se va dezvolta logica de control pentru fiecare dintre ele Multe dintre semnalele din registrele conductei M și W (Figura ) sunt transmise la etapele anterioare pentru a primi rezultate de rescriere, adrese de instrucțiuni și rezultate mutate Tratarea de dorit a cazurilor speciale de control Luați în considerare următorul exemplu de program pentru comanda ret Acest program este prezentat în Lista - , dar cu adresele diferitelor comenzi la care să se conecteze în partea stângă la Lista ; x :irmovi Stack, %esp # Inițializați indicatorul stivei x :caii proc# Apel de procedură x b:irmovi $ , %edx# Punct de returnare x : oprire x : poz x x : proc: x : ret# proc x : rrmovl %edx, %ebx# A eșuat x : poz x x : Stack# Stack Stack pointer Capitolul Arhitectura procesorului Pe fig Figura arată modul dorit de a gestiona comanda ret Ca și în cazul diagramelor conductelor, diagrama arată activitatea conductei cu valoarea timpului crescând spre dreapta Comenzile nu sunt listate în ordinea în care apar în program deoarece programul folosește logica de control în care comenzile nu sunt executate într-o secvență liniară Acordați atenție adreselor comenzilor pentru a vedea unde intră diferite comenzi în program Diagrama arată că instrucțiunea ret este preluată în timpul ciclului și începe să traverseze conducta, atingând stadiul de rescriere la ciclul Pe măsură ce comanda trece prin etapele de decodare, execuție și memorie, conducta nu poate efectua nicio activitate utilă În schimb, trei cercuri trebuie introduse în el Odată ce instrucțiunea ret ajunge la stadiul de rescriere, logica de selecție a PC-ului va seta contorul de program la adresa de retur și, astfel, etapa de preluare va selecta instrucțiunea irmovl la adresa punctului de retur (x b) fprog x : irmovl Stack,%edx FDEMW x : caii rgos fdemw x : ret FDEMW bule FDEMW bule FDEMW bubble FDEM w x b: irmovl $ ,%edx j Punct de returnare FDEM w Orez , Reprezentare simplificată a gestionării comenzilor de returnare Pe fig Figura - arată procesarea efectivă a comenzii ret pentru codul din Lista - Principala observație aici este că nu există nicio modalitate de a insera un cerc în etapa de preluare a acestei conducte Pe fiecare ciclu, etapa de preluare citește o anumită instrucțiune din memoria de instrucțiuni Dacă luăm în considerare codul HCL pentru implementarea logicii de predicție RS prezentată în Sec , putem vedea că pentru instrucțiunea ret, noua valoare estimată PC este vaIP, adresa următoarei instrucțiuni În acest program, valoarea va fi x , adresa comenzii rrmovi urmând ret Pentru acest exemplu, o astfel de prognoză este incorectă, deoarece nu va fi corectă pentru majoritatea cazurilor, cu toate acestea, în proiectul în cauză, sarcina de a prezice corect adresele de retur nu este stabilită Pentru trei cicluri de ceas, etapa de eșantionare este suspendată; aceasta selectează comanda rrmovi, dar o înlocuiește cu un cerc Acest proces este ilustrat în Fig ca trei mostre cu o săgeată care duce în jos către cercurile care trec prin etapele rămase ale conductei În cele din urmă, în bucla , este selectată comanda irmovl La compararea fig , cu fig Figura arată că această implementare realizează efectul dorit, dar cu preluarea specială a instrucțiunii incorecte timp de trei cicluri consecutive În ceea ce privește riscul de încărcare și utilizare, operațiunea dorită a conductei a fost deja descrisă în Sec și ilustrat cu un exemplu în Figura Date de la Partea I Structura și execuția programului memoria este citită numai de comenzile mrmovi și popi Când oricare dintre aceste instrucțiuni este în faza de execuție, iar instrucțiunea care necesită registrul de ieșire este în faza de decodificare, atunci a doua instrucțiune trebuie să fie menținută în acea etapă și cercul introdus în faza de execuție în ciclul următor Logica conductivă va elimina apoi riscul din date Conducta poate reține instrucțiunea în timpul etapei de decodificare prin menținerea registrului conductei D într-o stare fixă În acest caz, registrul conductei F trebuie să fie și el într-o stare fixă, astfel încât următoarea instrucțiune să fie reseletată În general, implementarea unui astfel de flux prin conducte necesită identificarea unei stări de risc, menținerea registrelor de conductă F și D într-o stare fixă și inserarea unui cerc în timpul rulării # an x : irmovl Stack,%edx FDEMW x : caii proc FDEM w x : ret FDEMW X : rrmovl %edx,%ebx # Neexecutat F bubble u DEMW x : rrmovl %edx,%ebx t Neexecutat F bubble L, DEMW x : rrmovl %edx,%ebx f Neexecutat F bule L> DEMW x b: irmovl $ ,%edx ț Punct de întoarcere FDEM w Orez , Procesarea efectivă a comenzii return Etapa de preluare selectează în mod repetat instrucțiunea gppoi în urma instrucțiunii ret, dar apoi logica de control al conductei inserează un cerc în etapa de decodificare în loc să permită instrucțiunii gppoi să înceapă execuția Comportamentul rezultat este echivalent cu cel prezentat în fig , Conducta prezice selecția ramurilor (Figura ) și începe să preia instrucțiuni pentru ținta ramurilor Două instrucțiuni sunt selectate înainte ca predicția greșită să fie detectată în ciclul , când instrucțiunea de ramificare trece faza de execuție În bucla , conducta anulează cele două comenzi țintă inserând cercuri în pașii de execuție și decodificare și selectează comanda după salt Pentru a gestiona o ramură estimată greșit, luați în considerare următorul program, prezentat în Lista , cu adresele de instrucțiuni afișate pentru referință în partea stângă I Lista Ramura prezisă incorect ; L ' l l ' ? gі x :xorl %eax, %eax x :jne target# Nu se poate selecta Capitolul Arhitectura procesorului x :irmovl $ , %eax# Transfer control down x d:halt oohoo: țintă: xoo:irmovl $ , %edx# Țintă x :irmovl $ , %ebx# Țintă + x a: oprire *progS x : xorl %eax,%eax x : jne target # Nu Oxoo: irmovl $ ,%edx # bubble* x : irmovl $ ,%ebx bubble x : irmovl $ ,%edx OxOOD: oprire FDEMW luat FDEMW FD țintă L»EMW Ținta F L>DEMW Cădeți prin FDEMW FDEM w Orez , Manipularea instrucțiunilor de filială neprevăzute Pe fig arată procesarea acestor comenzi Ca și înainte, comenzile sunt listate în ordinea în care intră în conductă, nu în ordinea în care apar în program Deoarece instrucțiunea de ramificare este prevăzută a fi preluată, instrucțiunea din ținta de ramificare este selectată în ciclul , iar instrucțiunea care o urmează este selectată în ciclul Până în momentul în care logica de ramificare determină că ramificația nu ar trebui să fie executată în timpul ciclului , sunt preluate două instrucțiuni, execuția care ar trebui deja oprită Din fericire, niciuna dintre aceste comenzi nu provoacă o schimbare de stare vizibilă pentru programator Acest lucru se întâmplă doar atunci când comanda ajunge la un timp de execuție în care poate fi declanșată o modificare a codului de condiție Două instrucțiuni alese incorect pot fi pur și simplu eliminate (uneori numite aplatizare a instrucțiunilor) inserând cercuri în instrucțiunile de decodificare și rulate în ciclul următor în timp ce preluăm instrucțiunea după instrucțiunea de salt Apoi, două comenzi selectate incorect vor dispărea pur și simplu din conductă Identificarea condițiilor speciale de control În tabel rezumă condițiile care necesită un control special al benzii transportoare Iată expresii HCL care descriu condițiile în care apar trei cazuri speciale Aceste expresii sunt implementate prin blocuri logice combinatorii simple care trebuie să-și genereze rezultatele înainte de sfârșitul ciclului de ceas pentru a controla acțiunile registrelor conductei pe măsură ce ceasul crește pentru a începe următorul ciclu În timpul unui ciclu de ceas, registrele pipeline D, E și M dețin stările instrucțiunilor din conductele de decodare, execuție și, respectiv, memorie La fel de Partea I Structura și execuția programului aproape de sfârșitul ciclului de ceas, semnalele d srcA și d srcB vor fi setate la identificatorii de registru ai operanzilor sursă pentru instrucțiuni în timpul etapei de decodare Identificarea instrucțiunii ret pe măsură ce trece prin conductă constă în verificarea codurilor de instrucțiuni la etapele de decodare, execuție și memorie Identificarea riscurilor de încărcare/utilizare constă în verificarea tipului comenzii (mrmovl sau popi) în timpul rulării și compararea registrului de ieșire al acesteia cu registrele sursă ale comenzii în etapa de decodare Logica de control a conductei trebuie să detecteze ramura estimată greșit în timp ce instrucțiunea de salt este în faza de execuție pentru a seta condițiile necesare pentru a restabili predicția pe măsură ce instrucțiunea intră în stadiul de memorie Când apare o instrucțiune de salt în timpul fazei de execuție, semnalul e Bch indică dacă să ia sau nu săritul Tabelul Dezvăluirea condițiilor pentru logica de control al conductelor Declanșare condiție Procesarea retragerii {DJcode, EJcode, MJcode} Riscurile de încărcare/utilizare EJcode e {IMRMOVL, IPOPL} && E dstM e {d srcA, d srcB} Ramura estimată greșit EJcode = IJXX && ! e Bch Trei condiții diferite necesită modificarea fluxului conductei, fie prin oprirea conductei, fie prin anularea comenzilor executate parțial Mecanisme de control al benzilor transportoare Pe fig Figura prezintă mecanismele de nivel scăzut care permit logicii de control al conductei să mențină o instrucțiune într-un registru al conductei sau să introducă un cerc în conductă Aceste mecanisme implică mici extensii ale registrului sincronizat de bază descris în Sect Să presupunem că fiecare registru de conductă are două intrări de control: stop și cerc Setările acestor semnale determină modul în care registrul conductei este actualizat atunci când ceasul crește În timpul funcționării normale, ambele intrări sunt setate la , ceea ce face ca registrul să încarce datele de intrare în noua sa stare Când semnalul de oprire (etichetat „Stall”) este setat la , actualizarea stării este dezactivată Registrul rămâne în starea anterioară Acest lucru face posibilă menținerea comenzii la o anumită etapă a conductei Când bula ("Bubble") este setată la , starea registrului va avea o configurație de restaurare, oferind o stare echivalentă cu starea comenzii pore Combinația specifică de și pentru o configurație de recuperare a registrului conductei depinde de setul de câmpuri din registrul conductei De exemplu, pentru a insera un cerc în registrul pipeline D, câmpul icode trebuie să aibă o valoare constantă inop (vezi Tabelul ) Pentru a insera un cerc în registrul pipeline E, câmpul icode trebuie să fie inop, iar câmpurile dstE, dstM, scrA și scrB trebuie să fie constanta rnone Determinarea configurației de recuperare este una dintre sarcinile pe care trebuie să le rezolve proiectantul hardware când Capitolul Arhitectura procesorului proiectarea registrului transportor Acest subiect nu este discutat în detaliu aici; setarea ambelor semnale la va fi interpretată ca o eroare Stare = x Intrare blocaj = ieșire=x bule - = O stare = La ieșire= X Stare = x stare = Intrare = y ieșire = x ieșire= X La La X stand = bule - = O Stare=x State = din moment ce Intrare = y ieșire = x ieșire= de cand X p o R tarabă = Oh bule -= Orez , Operațiuni suplimentare de înregistrare a conductelor Pe fig în condiții normale (A) starea și ieșirea registrului sunt setate la valoarea de la intrare când ceasul crește Când rulează în modul de oprire (B), starea rămâne fixă la valoarea anterioară Când se lucrează în modul cerc (C), starea este înlocuită (suprascrisă) cu starea operației por Tab Figura prezintă acțiunile pe care trebuie să le efectueze diferitele etape ale conductei pentru fiecare dintre cele trei condiții speciale Fiecare include o combinație de operațiuni în condiții normale, oprire și cerc pentru registrele conductelor Condiții diferite necesită modificarea fluxului conductei fie prin oprirea conductei, fie anularea comenzilor executate parțial În ceea ce privește sincronizarea, semnalele de control de blocare și bule pentru registrele pipeline sunt generate de blocuri logice combinatorii Aceste valori ar trebui Partea / Structura și execuția programului Vrem să fim validi pe măsură ce timpul crește, ceea ce face ca fiecare registru de conducte să se încarce, să se oprească sau să se încarce cu începutul fiecărui nou ciclu Cu astfel de extensii minore la proiectele de registru de conducte, este posibil să se implementeze o conductă completă, incluzând tot controlul său, folosind blocurile de bază ale logicii combinatorii, registrele sincronizate și memoria principală Tabelul Acțiuni de control al conductelor Stare Registrul conductei FD E M W Procesare ret Stop Cerc Normal, Condiții Normale, Condiții Normale, Condiții Riscuri încărcare/utilizare Oprire Oprire OK cerc, condiții OK, condiții Ramura de Norme prezisă incorect, condiții Cerc Norme, condiții Norme, condiții Combinații de condiții de control Până acum, când se discută condițiile speciale pentru controlul conductelor, s-a presupus că în timpul parcurgerii oricărui ciclu de sincronizare, poate apărea un singur caz special O greșeală comună în proiectarea sistemului este incapacitatea de a gestiona cazurile în care apar mai multe condiții speciale în același timp Să analizăm câteva dintre ele Pe fig este o diagramă care arată stările conductei care provoacă condiții specifice de control Aceste diagrame arată blocuri de pași de decodare, execuție și memorie Căsuțele umbrite indică anumite restricții care trebuie îndeplinite pentru ca afecțiunea să apară Riscul de încărcare/utilizare necesită ca instrucțiunea din timpul de execuție să citească valoarea din memorie într-un registru și ca instrucțiunea din etapa de decodare să aibă acel registru ca operand sursă Ramura estimată greșit necesită ca comanda de rulare să aibă o comandă de salt Există trei cazuri posibile pentru ret: instrucțiunea dată poate fi în faza de decodare, execuție sau memorie Pe măsură ce comanda ret progresează prin conductă, etapele anterioare ale conductei vor avea cercuri În aceste diagrame, se poate observa că majoritatea condițiilor de control se exclud reciproc De exemplu, nu este posibil să existe un risc de încărcare/utilizare și o ramură estimată greșit în același timp, deoarece prima necesită o comandă de încărcare (mrmovl sau popi) în timpul rulării, în timp ce cea din urmă necesită un salt De asemenea, a doua și a treia combinație ret nu pot apărea în același timp cu un risc de încărcare/utilizare sau cu o ramură estimată greșit Doar două combinații, indicate prin săgeți, pot apărea în același timp Capitolul Arhitectura procesorului Combinația A include o instrucțiune de salt neselectată în timpul rulării și o instrucțiune ret în etapa de decodare Setarea acestei combinații necesită ca comanda ret să fie în ținta ramurii neselectate Logica de control al conductei trebuie să determine dacă ramura a fost executată și, prin urmare, să anuleze comanda ret Încărcați/utilizați mlspredict ret ret ret m M M m M ret E Încărcare E JXX E E ret E bulă D Utilizați DD ret D bubble D bubble t Combinația A t Combinația B Orez , Stări de conductă pentru condiții speciale de control EXERCIȚIUL Scrieți un program în limbaj de asamblare Y care provoacă apariția combinației A și determină dacă este gestionată corect de logica de control Atunci când combinăm acțiunile de control pentru condițiile combinației A, obținem următoarele acțiuni de control pentru conductă, presupunând că cazul normal este înlocuit cu un cerc sau un opritor (Tabelul ) Tabelul Condiții de combinație A Stare Registrul conductei FD E M W Procesare ret Stop Cerc Normal, Condiții Normale, Condiții Normale, Condiții Ramura de Norme prezisă incorect, condiții Cerc Norme, condiții Norme, condiții Combinație Stop Cerc Cerc Normal, condiții Normale, condiții Adică, această combinație va fi procesată ca o ramură prezisă incorect, dar cu o oprire la etapa de eșantionare Din fericire, în următorul ciclu, logica de selecție a PC-ului va alege adresa instrucțiunii care urmează ramificația, mai degrabă decât contorul de program prezis, deci nu contează ce se întâmplă cu registrul pipeline F Se ajunge la concluzia că pipeline va procesați corect această combinație Combinația B include un risc de încărcare/utilizare, în care instrucțiunea de încărcare setează registrul %esp, după care instrucțiunea ret folosește acest registru ca operand sursă, Partea I Structura și execuția programului deoarece trebuie să scoată adresa de retur din stivă Logica de control al conductei trebuie să rețină instrucțiunea ret în timpul fazei de decodare Scrieți un program în limbaj de asamblare Y care provoacă apariția combinației B și iese cu o comandă hait dacă conducta funcționează corect Atunci când combinăm acțiunile de control pentru condițiile combinației B, obținem următoarele acțiuni de control pentru conductă (Tabelul ) Tabelul Condiții de combinare B Stare Registrul conductei FD E M W Procesare ret Stop Cerc Normal, Condiții Normale, Condiții Normale, Condiții Riscuri încărcare/utilizare Oprire Oprire OK cerc, condiții OK, condiții Combinație Stop Circle+ stop Circle Condiții normale Condiții normale Fix Stop Stop Cercul de Norme, Condiții Norme, Condiții Când ambele seturi de acțiuni se declanșează, logica de control va încerca să suspende comanda ret, pentru a evita riscul de încărcare/utilizare și va introduce un cerc în etapa de decodare, datorită comenzii ret Este clar că proiectantul nu are nevoie de conductă pentru a efectua ambele seturi de acțiuni In schimb, este necesar sa fie executate doar actiunile pentru riscul de incarcare/utilizare Procesarea comenzii ret trebuie întârziată cu un ciclu Această analiză arată că Combinația B necesită o manipulare specială De fapt, implementarea inițială a logicii de control PIPE a gestionat incorect această combinație În ciuda faptului că proiectul a trecut multe teste de simulare, a scos la iveală o eroare foarte mică care poate fi detectată doar folosind analiza descrisă Când se execută un program cu combinația B, logica de control ar seta semnalele de bule și de blocare pentru registrul conductei D la Acest exemplu demonstrează importanța analizei sistematice Este puțin probabil ca eroarea indicată să fie detectată prin simpla rulare a programelor normale Dacă nu ar fi remediat, conducta ar implementa incorect mapările de comportament ISA Capitolul Arhitectura procesorului Implementarea logicii de control Pe fig prezintă structura completă a logicii de control al transportorului Pe baza semnalelor de la registrele conductei și etapele conductei, logica de control generează semnalele de control al blocajului și al bulelor pentru registrele conductei Puteți combina condițiile din tabel cu acțiunile prezentate în tabel pentru a crea descrieri HCL ale diferitelor semnale de control al conductelor Registrul F trebuie oprit, fie cu riscul încărcării și utilizării lui, fie pentru comanda ret: bool F stall = # Condiții pentru riscul de descărcare/utilizare E icode în { IMRMOVL, IPOPL } && E dstM în { d srcA, d srcB } | | # Opriți-vă la etapa de preluare în timp ce comanda ret trece prin conducta IRET în { D icode, E icode, M icode }; Logice MJcode vale vaim dstE dstM icode bch CC valE valA L, dstE dstM F'St'v EJcode ^]icode| ifun valC valA valB dstE dstM srcA srcB QJcode * d srcA :D bubble O stall icode ifun rA rB valC valP F stand - Orez , Logica de control al conductei de conductă Această logică înlocuiește trecerea normală a comenzilor prin conductă pentru a gestiona condiții speciale, cum ar fi returnările procedurilor, ramurile estimate greșit și riscurile de încărcare/utilizare ^ , Scrieți codul HCL pentru semnalul D stall în implementarea PIPE Registrul de conductă D trebuie să fie setat la cerc pentru o comandă de ramificare sau retragere estimată greșit Cu toate acestea, ca analiza din precedenta Partea I Structura și execuția programului secțiunea, registrul nu trebuie să introducă un cerc atunci când există un risc de încărcare/utilizare în combinație cu comanda ret: booi D bubble = # Ramura prezisă incorect (E icode == IJXX && !e Bch) | | # Opriți-vă în etapa de preluare în timp ce comanda ret trece prin conductă IRET în { D icode, E icode, M icode }; EXERCIȚIUL Scrieți codul HCL pentru semnalul E bubble în implementarea PIPE Aceasta include toate valorile semnalului de control specifice transportorului În codul HCL complet pentru PIPE, toate celelalte semnale de control sunt setate la Analiza performanței Se poate observa că condițiile care necesită acțiuni speciale din partea logicii de control a conductei o împiedică să atingă scopul de a lansa o nouă comandă la fiecare ciclu de sincronizare O astfel de ineficiență poate fi măsurată prin determinarea frecvenței cu care un cerc este introdus în conductă, deoarece acest lucru provoacă apariția ciclurilor de conductă neutilizate Comanda return generează trei cercuri, riscul de descărcare și utilizare generează unul, iar ramura estimată greșit generează două Puteți cuantifica impactul acestor probleme asupra performanței generale prin calcularea numărului mediu de cicluri de ceas cerut de PIPE pentru fiecare instrucțiune executată, o unitate cunoscută sub numele de CPI (cicluri pe instrucțiune) Aceasta este reciproca debitului mediu al conductei, cu timpul măsurat în cicluri de ceas, mai degrabă decât în picosecunde Această unitate de măsură este foarte utilă în evaluarea performanței arhitecturale a unui proiect De asemenea, puteți privi CPI din cealaltă parte: imaginați-vă că procesorul rulează pe un program de testare de referință și acordați atenție funcționării etapei de execuție Pe fiecare buclă, pasul de rulare va procesa fie o comandă care continuă prin pașii rămași până la finalizare, fie un cerc inserat din cauza unuia dintre cele trei cazuri speciale Dacă etapa procesează numărul total de instrucțiuni C/ și cercuri C/>, atunci procesorul va avea nevoie de aproximativ C + Q cicluri complete de ceas pentru a executa instrucțiunile C Cuvântul „comanda” este folosit aici deoarece ignoră buclele necesare pentru a rula instrucțiunile prin conductă CPI pentru acest program de testare poate fi calculat după cum urmează Adică IPC-ul este , plus elementul de penalizare CJCb, indicând numărul mediu de cercuri inserate pe comandă executată Deoarece doar trei tipuri diferite de comenzi pot invoca inserarea unui cerc, acest element suplimentar poate fi împărțit în trei componente: CPI \u d \ O + lp + mp + gr, Capitolul Arhitectura procesorului Unde: □ Ір (penalizare de încărcare, penalizare de încărcare) - frecvența medie cu care sunt introduse cercurile în timpul unei opriri din cauza riscurilor de încărcare/utilizare; □ mp (penalizare de ramificare greșită) — frecvența medie cu care sunt inserate cercurile atunci când o comandă este anulată din cauza ramurilor incorect prezise; □ gr (penalizare de retur, penalizare de retur) - frecvența medie cu care sunt inserate cercurile la oprirea comenzilor ret Fiecare dintre aceste penalități indică numărul total de cercuri inserate pentru motivul declarat (o parte din SD împărțită la numărul total de comenzi executate (C,) Pentru a evalua fiecare dintre aceste penalități, este necesar să se cunoască frecvența de apariție a comenzilor corespunzătoare (încărcare, ramificare condiționată și retur) și, pentru fiecare comandă, frecvența de apariție a condiției speciale Pentru calculele CPI, alegem următorul set de frecvențe (sunt comparabile cu măsurătorile date în [ ] și [ ]): □ Comenzile de încărcare (mrmovl și popi) reprezintă % din toate comenzile executate % dintre ele provoacă riscuri de descărcare/utilizare □ Ramurile condiționate reprezintă % din toate comenzile executate % dintre ei sunt selectați și % nu sunt selectați □ Comenzile returnate reprezintă % din toate comenzile executabile Astfel, fiecare dintre penalități poate fi considerată ca produsul dintre frecvența tipului de comandă, frecvența la care apare condiția și numărul de cercuri inserate atunci când apare condiția (Tabelul ): Tabelul amenzi Motiv Nume Frecventa comenzii Conditie Frecventa Cercuri Produs Descărcați/Utilizați IP Prognoza incorecta mp , , , Returul GR , , , Penalizare generală , Suma celor trei penalități este , , ceea ce dă o valoare IPC de , Scopul nostru a fost să creăm un proiect de conductă care ar putea emite o instrucțiune pe ciclu, cu un CPI rezultat de , Acest obiectiv nu a fost atins pe deplin, dar performanța generală este încă destul de ridicată De asemenea, este clar că orice încercare de a reduce și mai mult IPC trebuie să se concentreze asupra ramurilor estimate greșit Sunt , din penalitatea totală de , deoarece ramurile condiționate sunt foarte frecvente, Partea I Structura și execuția programului strategia de predicție eșuează adesea și pentru fiecare eroare de predicție, două echipe sunt anulate EXERCIȚIUL Să presupunem că se utilizează strategia de predicție a ramurilor „Backward Selection No Direct Selection” (BTFNT), obținând o rată de succes de % (vezi Secțiunea ) Care va fi efectul asupra CPI, presupunând că toate celelalte frecvențe nu sunt afectate? lucrare neterminată Acum a fost creată structura pentru microprocesorul pipelined PIPE, blocurile logice de control au fost proiectate și logica de control a procesorului a fost implementată pentru a face față cazurilor speciale în care fluxul obișnuit pipelined nu este suficient Cu toate acestea, PIPE încă îi lipsesc câteva caracteristici cheie care vor fi necesare în designul propriu-zis al microprocesorului Unele dintre ele sunt discutate mai jos, împreună cu ceea ce este necesar pentru a le adăuga Gestionarea excepțiilor Când un program la nivel de mașină întâlnește o condiție de eroare, cum ar fi un cod de instrucțiune invalid, o instrucțiune sau o adresă de date care se află în afara spațiului de adrese, atunci apare o eroare în timpul execuției programului, numită excepție Comportamentul acestuia din urmă amintește de apelarea unei proceduri care activează un handler de excepții, procedură inclusă în sistemul de operare Gestionarea excepțiilor este tratată mai detaliat în Capitolul Hait trebuie să arunce și o excepție Gestionarea excepțiilor face parte din arhitectura setului de instrucțiuni pentru procesor În general, apariția unei excepții ar trebui să oprească procesorul în punctul imediat dinaintea instrucțiunii care a apelat-o sau imediat după aceasta, în funcție de tipul de excepție Evident, toate comenzile până la punctul în care apare excepția trebuie executate, dar niciuna dintre comenzile imediat următoare acestui punct nu ar trebui să aibă vreun efect asupra stării vizibile pentru programator Într-un sistem de conducte, gestionarea excepțiilor are anumite subtilități În primul rând, excepțiile pot fi declanșate simultan de comenzi multicast De exemplu, în timpul unui ciclu de operare prin conducte, puteți organiza următoarea ordine: □ memoria pentru stocarea comenzilor va raporta la faza de preluare adresa comenzii care depaseste limitele stabilite; □ memoria pentru stocarea datelor va raporta la stadiul de memorie adresa datelor care se află în afara intervalului; □ Logica de control va raporta un cod invalid pentru comandă în timpul pasului de decodare Capitolul Arhitectura procesorului Acum trebuie să stabilim care dintre aceste excepții ar trebui să raporteze procesorul sistemului de operare Regula generală este de a acorda prioritate celei mai îndepărtate excepții din conducta care este declanșată de comandă În exemplul de mai sus, această situație ar fi o adresă care se află în afara spațiului de adrese la care instrucțiunea va încerca să ajungă în stadiul de memorie În ceea ce privește programul la nivel de mașină, instrucțiunea din faza de memorie ar trebui să fie executată înainte ca comenzile din fazele de decodare sau preluare să fie executate și, prin urmare, doar această excepție trebuie raportată sistemului de operare A doua caracteristică apare atunci când o comandă este preluată, începe executarea, aruncă o excepție și este ulterior anulată din cauza unei ramuri estimate greșit Lista prezintă un exemplu de astfel de program sub formă de cod obiect: x : xorl %eax, %eax x : e |jne Target# Nu se poate selecta x : Iirmovi $ , %eax# Controlul transferului în jos x d: oprire x e:| ţintă: x e: ffl byte OxFF# Cod de comandă nevalid În acest program, pipeline-ul prezice că ramura nu trebuie luată, așa că va alege și va încerca să folosească octetul cu valoarea Oxff ca comandă (generat în codul de compunere folosind directiva byte) Prin urmare, pasul de decodare va prinde excepția de comandă nevalidă Mai târziu, conducta va detecta că ramura este respinsă, astfel încât instrucțiunea de la adresa x e nici măcar nu ar trebui să fie preluată Logica de control a conductei va suprascrie această comandă, dar face parte din provocare de a evita aruncarea excepției A treia subtilitate provine din faptul că procesorul pipeline actualizează diferite părți ale stării sistemului în diferite etape Comanda care urmează comenzii care aruncă excepția poate schimba o parte a stării înainte ca comanda de excepție să se finalizeze De exemplu, luați în considerare următoarea secvență de cod (Listarea - ), care presupune că programele utilizator nu accesează adrese mai mari de xsOOOOOOOO (cum este cazul versiunilor curente de Linux, vezi capitolul IO) irmovi $ , %esp# Setați indicatorul de stivă la pushl %eax# Încercați să scrieți la Oxffffffffc addl %esx, %eax# Setați codurile de stare Partea I Structura și execuția programului Comanda pushl aruncă o excepție deoarece decrementarea pointerului stivei îl înfășoară în Oxffffffffc Această excepție este prinsă în faza de memorie În aceeași buclă, comanda addl este în desfășurare și face ca codurile de condiție să fie setate la valori noi Acest lucru încalcă cerința conform căreia nicio comandă care urmează punctul la care a fost ridicată excepția nu ar trebui să aibă vreun efect asupra stării sistemului În general, este posibil să se selecteze corect diverse excepții și să se evite pe acestea din urmă pentru comenzile datorate ramurilor incorect prezise, prin încorporarea logicii de gestionare a excepțiilor în structura conductei Un câmp special exc este adăugat la fiecare registru de conductă, oferind instrucțiunii o stare de excepție în această etapă Dacă comanda aruncă o excepție la un moment dat în procesare, atunci un câmp de stare este setat pentru a indica natura excepției Condiția de excepție este transmisă cu restul informațiilor pentru instrucțiunea dată până când ajunge la stadiul de rescriere În acest moment, logica de control al conductei detectează apariția excepției și inițiază preluarea codului pentru handlerul de excepție Pentru a evita actualizarea stării vizibile de programator prin instrucțiuni care urmează punctului de excepție, logica de control al conductei trebuie modificată pentru a bloca orice actualizare a registrului codului de condiție sau a stocării datelor atunci când o instrucțiune din faza de memorie sau de scriere înapoi ridică o excepție În Lista - , logica de control detectează că comanda pushl în faza de memorie a aruncat o excepție și, prin urmare, actualizarea registrului de cod de condiție de către comanda addl va fi blocată (Simulatorul PIPE va arăta implementări ale tehnicilor de gestionare a excepțiilor într-un procesor pipeline ) Să vedem cum se aplică această metodă de gestionare a excepțiilor subtilităților descrise Când apare o excepție la una sau mai multe etape ale conductei, informațiile sunt pur și simplu stocate în câmpurile de excepție ale registrelor conductei Acest eveniment nu are efect asupra fluxului de instrucțiuni din conductă până când instrucțiunea de excepție ajunge la ultima etapă a conductei, cu excepția blocării oricăror actualizări ale stării vizibile de programator (registru sau memorie a codului de condiție) prin instrucțiuni ulterioare din conductă Deoarece instrucțiunile ajung în stadiul de rescriere în aceeași ordine în care s-ar fi executat pe un procesor fără o conductă, este sigur să presupunem că prima instrucțiune care întâlnește o excepție va fi prima instrucțiune care declanșează un transfer către handlerul de excepție Dacă o comandă este selectată, dar ulterior anulată, atunci orice informație despre starea excepțională a acelei comenzi este de asemenea anulată Nicio instrucțiune care urmează instrucțiunea care a cauzat excepția nu poate schimba starea vizibilă pentru programator O regulă simplă pentru transportul unei excepții, împreună cu toate informațiile despre comandă prin conductă, formează un mecanism simplu și de încredere pentru gestionarea excepțiilor Capitolul Arhitectura procesorului Comenzi multiple Toate comenzile din setul de instrucțiuni Y includ operații simple, cum ar fi adăugarea de numere Ele pot fi procesate într-un singur ciclu de sincronizare în timpul rulării Un set de instrucțiuni mai complet va trebui să implementeze instrucțiuni care necesită operații mai complexe, cum ar fi înmulțirea și împărțirea numerelor întregi, precum și operații cu virgulă mobilă Pe un procesor mid-range, cum ar fi PIPE, timpul de execuție tipic pentru aceste operațiuni este de - cicluri pentru adăugarea în virgulă mobilă, până la de cicluri pentru diviziunea întregului Implementarea acestor comenzi necesită atât hardware suplimentar pentru a efectua calcule, cât și un mecanism de coordonare a procesării acestor comenzi de către componentele rămase ale conductei O abordare simplă pentru implementarea mai multor instrucțiuni este extinderea logicii de rulare la unități aritmetice, cum ar fi numerele întregi și numere în virgulă mobilă Instrucțiunea rămâne în faza de execuție pentru câte cicluri de ceas are nevoie, ceea ce va determina oprirea fazelor de preluare și decodificare Implementarea acestei abordări este simplă, dar performanța finală nu este foarte mare Performanțe mai mari pot fi obținute prin procesarea operațiunilor complexe cu dispozitive hardware speciale care funcționează independent de conducta principală De regulă, o unitate funcțională este utilizată pentru a efectua înmulțirea și împărțirea numerelor întregi și pentru a efectua operații cu numere în virgulă mobilă Când o comandă intră în etapa de decodare, aceasta poate fi emisă către un dispozitiv special În timp ce dispozitivul efectuează operația, conducta continuă să proceseze alte comenzi De obicei, procesorul în virgulă mobilă în sine este pipelined, astfel încât operațiunile pot fi efectuate în paralel pe conducta principală și pe diferite dispozitive Operațiunile diferitelor dispozitive trebuie sincronizate pentru a evita comportamentul incorect De exemplu, dacă există dependențe de date între diferite operațiuni procesate de diferite dispozitive, este posibil ca logica de control să fie nevoie să suspende o parte a sistemului până la finalizarea operațiunii procesate de o altă parte a sistemului Adesea, sunt folosite diferite forme de mișcare pentru a transfera rezultatele dintr-o parte a sistemului în altele, așa cum sa întâmplat între diferitele etape ale TUBALOR Designul general devine mai complex decât cu PIPE, dar aceleași tehnici de oprire, deplasare și control al conductei pot fi utilizate pentru a face comportamentul conform modelului ISA secvenţial Împerecherea cu un sistem de memorie Reprezentarea PIPE a presupus că atât dispozitivul de preluare a instrucțiunilor, cât și depozitul de date pot citi sau scrie în orice locație de memorie într-un singur ciclu de ceas În același timp, au fost ignorate posibilele riscuri cauzate de codul autoschimbător, atunci când o instrucțiune scrie într-o zonă de memorie din care sunt selectate instrucțiunile ulterioare Mai mult, mai mult Partea / Structura și execuția programului Accesul la celulele de memorie se efectuează în conformitate cu adresele lor virtuale, care necesită conversie în adrese fizice înainte de efectuarea operațiunilor efective de citire sau scriere Este clar că este imposibil să se efectueze toate procesele de mai sus într-un singur ciclu În plus, valorile de memorie accesate pot fi stocate pe disc, necesitând citirea a milioane de cicluri de ceas în memoria procesorului Capitolele și vor discuta despre modul în care sistemul de memorie al procesorului utilizează o combinație de blocuri de memorie hardware și software de sistem de operare pentru a gestiona sistemul de memorie virtuală Sistemul de memorie este organizat ca o ierarhie de blocuri de memorie mai rapide, dar mai mici, care conțin un subset de memorie susținut de blocuri de memorie mai lente și mai mari La nivelul cel mai apropiat de procesor, blocurile cache oferă acces rapid la locațiile de memorie la care se referă cel mai mult Un procesor tipic are două cache L , unul pentru citirea instrucțiunilor și celălalt pentru citirea și scrierea datelor Un alt tip de cache, cunoscut sub numele de Fast Address Translation Buffer (TLB), oferă o traducere rapidă a adreselor virtuale în fizice Cu o combinație de TLB și blocuri cache, puteți citi comenzi și puteți citi sau scrie date de cele mai multe ori într-un singur ciclu de ceas Astfel, o reprezentare simplificată a referințelor la celulele de memorie procesor este destul de acceptabilă Chiar dacă blocurile cache conțin cele mai multe celule la care se face referire, se întâmplă ca o așa-numită pierdere a memoriei cache să apară atunci când se face referire la o celulă care nu se află în ea În cel mai bun caz, datele lipsă pot fi preluate dintr-un cache de nivel superior sau din memoria principală a procesorului, necesitând până la de cicluri de ceas În acest timp, conducta se oprește pur și simplu, menținând instrucțiunea în faza de preluare sau de memorie până când memoria cache efectuează o operație de citire sau scriere În ceea ce privește proiectarea conductei în cauză, acest lucru se poate realiza prin adăugarea mai multor condiții de oprire la logica de control al conductei Pierderea cache-ului și sincronizarea ulterioară cu conducta este complet controlată de hardware, timpul necesar fiind legat de un număr mic de cicluri de sincronizare În unele cazuri, locația de memorie referită este de fapt stocată în memorie pe disc În acest caz, hardware-ul semnalează o excepție de eroare a paginii de disc Ca și alte excepții, determină procesorul să invoce codul de gestionare a excepțiilor sistemului de operare Acest cod începe transferul de pe disc în memoria principală La finalizarea acestei operațiuni, sistemul de operare va reveni la programul original, unde comanda care a cauzat eroarea paginii disc va fi executată din nou De această dată, referința locației de memorie va reuși, deși poate cauza o pierdere a memoriei cache Rularea unei rutine de sistem de operare de către hardware, care apoi returnează controlul dispozitivelor hardware, permite hardware-ului și software-ului să interacționeze în timpul procesării Capitolul Arhitectura procesorului erori de pagină de disc Deoarece accesul la disc poate necesita milioane de cicluri de sincronizare, cele câteva mii de cicluri de procesare efectuate de gestionarea erorilor de pagină de disc al sistemului de operare nu vor afecta semnificativ performanța procesorului Din punctul de vedere al procesorului, combinația de blocaje pentru a gestiona erorile scurte de cache și gestionarea excepțiilor pentru a gestiona erorile de pagină lungi de disc are grijă de impredictibilitatea timpilor de acces la memorie datorită structurii ierarhiei sale Dezvoltarea unui procesor modern O conductă în cinci etape, similară cu procesorul PIPE discutat, a introdus designul unui procesor modern la mijlocul anilor Prototipul de procesor RISC, dezvoltat de grupul de cercetare Berkeley al lui Patterson, a pus bazele procesorului SPARC, dezvoltat de Sun Misgo-systems în Procesorul, dezvoltat de grupul de cercetare Hennessy de la Stanford, a fost introdus pe piață de MIPS Technologies ( companie fondată de Hennessy) în Ambele modele au folosit transportoare în cinci trepte Procesorul Intel І folosește, de asemenea, o conductă în cinci etape, dar cu o împărțire diferită a responsabilității între etape; există două etape de decodare și o etapă combinată de execuție/stocare (execuție, memorie) Astfel de proiecte de conducte sunt limitate la maximum o instrucțiune pe ciclu de ceas Unitatea de măsură IPC, descrisă în sec , nu poate fi niciodată mai mică de Etape diferite pot procesa o singură comandă la un moment dat Procesoarele ulterioare acceptă funcționarea superscalară, adică ating un CPI mai mic de , prin preluarea, decodificarea și executarea mai multor instrucțiuni în paralel Pe măsură ce procesoarele superscalare au devenit mai comune, cifra de performanță acceptabilă s-a mutat de la CPI la opusul său: numărul mediu de instrucțiuni executate pe ciclu de ceas sau IPC (instrucțiuni per ciclu) În procesoarele superscalare, IPC poate depăși , Cele mai avansate modele folosesc o tehnică cunoscută sub numele de execuție de resecvențiere pentru a executa instrucțiunile în paralel, poate într-o ordine complet diferită de cea care apar în program, menținând în același timp comportamentul general care stă la baza modelului ISA serial Această formă de execuție este discutată în Capitolul ca unul dintre subiectele din discuția despre optimizarea programului Cu toate acestea, procesoarele pipeline nu sunt doar artefacte istorice Majoritatea procesoarelor vândute în lume sunt folosite în sisteme încorporate care controlează funcțiile mașinilor, în produsele de larg consum și în alte dispozitive în care procesorul în sine este invizibil pentru utilizator În astfel de mașini, simplitatea procesorului pipeline discutat în acest capitol reduce costul și consumul de energie în comparație cu procesoarele cu performanță mai mare Partea I, Structura și Execuția Programului rezumat Din materialul din acest capitol, devine clar că arhitectura setului de instrucțiuni (ISA) oferă versatilitate în ceea ce privește setul de instrucțiuni și codificările acestora, precum și metodele de implementare a procesorului ISA oferă o reprezentare vizuală a execuției programului atunci când o instrucțiune se finalizează complet înainte de a începe următoarea Descrierea setului de instrucțiuni Y a început cu instrucțiunile IA și o simplificare semnificativă a tipurilor de date, a modurilor de adresă și a codificărilor de instrucțiuni ISA rezultat se aplică atât setului de instrucțiuni RISC, cât și CISC Procesarea necesară pentru diferitele comenzi a fost apoi organizată într-o serie de șase pași, fiecare pas variind în funcție de comanda executată Din aceasta a fost creat procesorul SEQ, în care fiecare ciclu de ceas constă în împărțirea lui în șase etape și trecerea instrucțiunii prin fiecare dintre ele Prin reordonarea pașilor se obține un design SEQ+, în care primul pas determină valoarea contorului programului folosită pentru a invoca această comandă Procesarea pipeline îmbunătățește performanța sistemului atunci când diferiți pași sunt executați în paralel În orice moment, etapele conductei procesează diferite operațiuni Este necesar să se asigure utilizatorului emularea execuției secvențiale a programului Conceptul de conductă este apoi introdus prin adăugarea registrelor de conductă la SEQ+ și rearanjarea buclelor pentru a crea o conductă PIPE- Performanța conductei este mult îmbunătățită prin adăugarea logicii de mișcare pentru a accelera trimiterea rezultatului de la o instrucțiune la alta Câteva cazuri speciale necesită o logică suplimentară de control al conductei pentru a întrerupe sau anula anumiți pași ai conductei Acest capitol a acoperit mai multe lecții referitoare la designul procesorului: □ Managementul complexității este o prioritate de top Scopul principal este realizarea unei utilizări optime a resurselor hardware pentru a obține performanțe maxime la costuri minime Problema este rezolvată prin crearea unei structuri foarte simple și universale pentru procesarea tuturor tipurilor de comenzi existente Cu această structură, dispozitivele hardware pot fi separate în cadrul logicii pentru a gestiona diferite tipuri de comenzi □ Nu este nevoie de implementarea directă a ISA O implementare directă a ISA ar însemna un proiect pur secvenţial Pentru a obține performanțe mai mari, este necesar să folosiți capacitatea hardware-ului de a efectua un număr mare de operațiuni simultan Acest lucru a condus la utilizarea designului liniei de asamblare Printr-o proiectare și o analiză atentă, pot fi evitate diferitele riscuri ale conductei, astfel încât efectul general al rulării programului să fie exact același cu ceea ce se poate obține folosind modelul ISA □ Designerii de hardware trebuie să fie foarte pretențioși Dacă microcircuitul este deja fabricat, atunci corectați orice erori în practică Capitolul Arhitectura procesorului chesky imposibil Este foarte important ca procesul de proiectare să fie impecabil încă de la început Aceasta implică cea mai detaliată analiză a diferitelor tipuri de instrucțiuni și combinații, chiar și a celor care, la prima vedere, sunt lipsite de sens (de exemplu, apariția unui indicator de stivă) Toate proiectele trebuie testate temeinic folosind modele de testare a sistemelor La elaborarea logicii de control pentru PIPE în proiectul luat în considerare, a fost făcută o mică eroare, care a fost descoperită numai după o analiză amănunțită și sistematică a combinațiilor de control Simulatoare Y Laboratoarele din acest capitol includ simulatoare pentru procesoarele SEQ, SEQ+ și PIPE Fiecare simulator este disponibil în două versiuni: □ Versiunea GUI (Graphical User Interface) afișează memoria, codul programului și starea procesorului în ferestrele grafice În acest caz, este foarte convenabil să observați fluxul de instrucțiuni din procesor Panoul de control vă permite să reîncărcați interactiv simulatorul, să-l rulați sau să urmați pașii Aceste versiuni necesită limbajul de scripting Tci și biblioteca grafică Tk □ Versiunea text rulează același simulator, dar informațiile sunt afișate numai atunci când sunt imprimate pe terminal Această versiune este de mică valoare pentru depanare, dar permite testarea automată a procesorului și poate fi rulată pe un sistem care nu acceptă Tcl/Tk Logica de control pentru simulatoare este generată prin conversia declarațiilor blocului logic HCL în cod C Acest cod este apoi compilat și legat la codul de simulare rămas Această combinație vă permite să testați variante ale modelelor originale folosind simulatoare Sunt disponibile, de asemenea, scripturi de testare care testează complet diferite comenzi și diferite oportunități de risc Note bibliografice Pentru cei interesați de detaliile designului logic, un material introductiv standard este manualul de proiectare logică al lui Katz [ ], care pune accent pe utilizarea limbajelor de descriere hardware Manualul Hennessy și Patterson despre arhitectura computerelor [ ] detaliază problemele de proiectare a procesorului, incluzând atât conducte simple, precum cel descris aici, cât și procesoare mai avansate care execută mai multe instrucțiuni în paralel Shriver și Smith [ ] oferă o descriere foarte detaliată a procesorului IA compatibil Intel fabricat de AMD Partea I Structura și execuția programului s gV V Sarcini pentru soluție acasă În exemplul de program Y , cum ar fi funcția Sum prezentată în Lista , există multe situații (de exemplu liniile și și liniile și ) în care trebuie adăugată o valoare constantă la un registru Acest lucru necesită mai întâi utilizarea comenzii irmovi pentru a seta registrul la o constantă, apoi utilizarea comenzii addl pentru a adăuga acea valoare la registrul de ieșire Să presupunem că vrem să adăugăm o nouă comandă iaddl cu următorul format: octet iaddl V, GV Această instrucțiune adaugă o valoare constantă V registrului hV Descrieți calculele efectuate pentru implementarea acestei comenzi Utilizați calculele pentru irmovi și opi ca ghid (vezi Tabelul ) EXERCIȚIUL ♦ După cum este descris în sect , comanda A ieave poate fi folosită pentru a pregăti stiva pentru retragere Aceasta este echivalentă cu următoarea secvență de cod Y : rrmovl %ebp %esp Setați indicatorul stivei la începutul cadrului popl%ebp Restaurați %ebp și setați stiva ptr la sfârșit Să presupunem că această comandă este adăugată la sistemul de comandă Y utilizând următoarea codificare (Figura ): octet Lasă D Orez , Codificarea comenzilor Descrieți calculele efectuate pentru implementarea acestei comenzi Utilizați calculele pentru popi ca ghid (vezi Tabelul ) EXERCIȚIUL ♦♦ Fișierul seq fuii hci conține descrierea HCL pentru SEQ împreună cu declarația constantei iiaddl, care are valoarea hexazecimală c—codul de comandă pentru iaddl Modificați definițiile HCL ale blocurilor logice de control pentru a implementa comanda iaddl așa cum este descris în Ex EXERCIȚIUL ♦♦ Fișierul seq fuli hcl conține, de asemenea, declarația constantei ileave, care are valoarea hexazecimală D, codul de comandă pentru ieave și declarația constantei rebp, Capitolul Arhitectura procesorului având valoarea este identificatorul de registru pentru %ebp Modificați definițiile HCL ale blocurilor logice de control pentru a implementa comanda ieave așa cum este descris în Ex E , ♦♦♦ Să presupunem că dorim să construim un procesor pipeline ieftin bazat pe structura dezvoltată pentru PIPE- (vezi figurile și ) fără ramuri paralele Acest proiect va procesa toate dependențele de date prin oprire până când comanda care generează valoarea necesară a trecut de etapa de rescriere Fișierul pipe stall hcl conține o versiune modificată a codului PIPE HCL care dezactivează logica de ocolire Adică, semnalele e va!A și e va!B sunt pur și simplu declarate după cum urmează: ## NU SCHIMBAȚI URMĂTORUL COD ## Nicio promovare vaIA - fie vaIP, fie o valoare dintr-un fișier de registru int new E vaLA = [ D icode în { ICALL, IJXX } : D valP; # Utilizați computerul incrementat : d rvalA; # Utilizați valoarea citită din fișierul de înregistrare ]; ## Nicio promovare valB — valoare din fișierul de registru int new E valB = D rvalB; Modificați logica de control al conductei la sfârșitul acestui fișier, astfel încât să gestioneze corect toate riscurile posibile de control și date Ca parte a efortului de proiectare, este necesar să se analizeze diferite combinații de cazuri de control, așa cum sa făcut la proiectarea logicii de control a conductei PIPE Pot exista multe combinații diferite aici, deoarece atât de multe condiții impun ca transportorul să se oprească Asigurați-vă că logica de control gestionează corect fiecare combinație , ♦♦ Fișierul pipe full hcl conține o copie a declarației HCL PIPE împreună cu declarația de valoare constantă IIADDL Modificați acest fișier pentru a implementa comanda iaddl așa cum este descris în Ex UP?A ZHNEHIIE ♦♦♦ Fișierul pipe full hcl conține, de asemenea, declarații constante ILEAVE și REBP Modificați acest fișier pentru a implementa comanda ieave așa cum este descris în Ex Pentru instrucțiuni despre cum să generați un simulator pentru o soluție și să îl testați, consultați laboratoarele EXERCIȚIUL - ♦♦ ♦ Fișierul pipe nt hcl conține o copie a codului HCL pentru PIPE plus o declarație a valorii constante j yes cu valoarea , codul de mod pentru comanda de transfer necondiționat Partea / Structura și execuția programului mutare Modificați logica ramurilor astfel încât să prezică ramurile condiționate ca neselectate în timp ce prezice ramurile necondiționate și caii ca fiind selectate Va fi nevoie să se inventeze o modalitate de a obține vaIC - adresa destinației tranziției la registrul conductei M - pentru recuperarea din ramuri incorect prezise P RJN ENI E A*? Fișierul pipe nt hcl conține o copie a codului HCL pentru PIPE plus o declarație a valorii constante j da cu valoarea o, codul de mod pentru instrucțiunea de ramificare necondiționată Modificați logica ramurilor astfel încât să prezică ramuri condiționate așa cum sunt selectate când vaIC vaIP (ramură înainte) Continuați să preziceți sărituri necondiționate și caii așa cum sunt selectate Va fi nevoie să se inventeze o modalitate de a obține vaIC și vaIP pentru ca registrul M pipeline să se recupereze din ramuri incorect prezise EXERCIȚIUL ♦♦♦ În proiectarea PIPE discutată, o întrerupere este generată ori de câte ori o instrucțiune efectuează o încărcare, citind o valoare din memorie într-un registru, iar instrucțiunea următoare necesită acel registru ca operand sursă Când sursa este utilizată în timpul rulării, oprirea este singura modalitate de a evita riscul În cazurile în care a doua instrucțiune reține operandul de memorie original, cum ar fi cu rmmovi sau pushl, atunci nu este necesară oprirea Luați în considerare următoarele exemple de cod (Listarea ) ! * " ~ "Se * ' $ xv * x ' - y, ) Un algoritm pentru calcularea m și b poate fi obținut prin calcularea derivatelor lui E(m, b) date m și b și setându-le la EXERCIȚII? • Mai târziu în capitol, vom lua o singură funcție și vom genera multe variante diferite care păstrează comportamentul funcției, dar cu caracteristici de performanță diferite Pentru trei dintre aceste opțiuni, s-a constatat că timpii de execuție (în cicluri de ceas) pot fi aproximați prin următoarele funcții: □ + l □ + l □ + , l Pentru ce valori ale lui n fiecare versiune va rula cel mai repede? Rețineți că eu voi fi întotdeauna un număr întreg Exemplu de program Pentru a demonstra cum un program abstract poate fi transformat sistematic într-un cod mai eficient, luați în considerare structura de date vectoriale simplă prezentată în Figura Vectorul este reprezentat ca două blocuri de memorie Antetul este structura declarată în Lista /* Creați un tip de date abstract pentru vector */ typedef struct { intlen; data t *date; } vec rec, *vec ptr lungime lungime- date •-► Orez Tip de date vectoriale abstracte Această declarație folosește tipul de date data t pentru a indica tipul de date al elementelor subiacente Calculele curente măsoară performanța codului pentru Partea I Structura și execuția programului tipuri de date int, fioat și double Acest lucru este determinat prin compilarea și executarea separată a programului pentru diferite declarații de tip, ca în exemplul următor: typedef int data t; În plus față de antet, o matrice de obiecte len de tipul date t este alocată pentru a păstra elementele vectoriale reale Lista prezintă câteva proceduri de bază de generare a vectorului, accesarea elementelor vectoriale și determinarea lungimii vectorului Un punct important de remarcat este că get vec element , rutina de acces vectorială, efectuează verificări ale limitelor pentru fiecare referință de vector Acest cod este similar cu reprezentările matrice utilizate în multe alte limbi, inclusiv Java Verificările limitelor reduc șansele unei erori de program, dar, așa cum se va vedea mai târziu, are și un impact semnificativ asupra performanței programului Ca exemplu de optimizare, luați în considerare Lista , care combină toate elementele unui vector într-o singură valoare, conform unei operații specifice Folosind diferite definiții ale constantelor ident și operare în timpul compilării, codul poate fi recompilat pentru a efectua diferite operații asupra datelor În special, utilizarea declarațiilor #define IDENT O #define OPER + se însumează elementele vectorului Folosind reclame #define IDENT #define OPER + se calculează produsul elementelor vectoriale Ca punct de plecare în tabel Figura prezintă măsurătorile CPE pentru combinei care rulează pe un Intel Pentium III, testând toate combinațiile de tipuri de date și operațiuni Conform măsurătorilor, se constată că valorile de sincronizare sunt de obicei egale cu datele standard și cu precizie dublă în virgulă mobilă Prin urmare, sunt prezentate doar măsurători obișnuite de precizie Tabelul Valori CPE pentru diferite tipuri Funcție Pagina Metodă Integer Float +* -* combinei Abstracte, neoptimizate , , , , combinei Abstract - Capitolul Optimizarea performanței programului h Lista unu cinci opt nouă unsprezece paisprezece cincisprezece optsprezece nouăsprezece douăzeci treizeci /* Creați un vector de lungime dată */ vec ptr new vec(int len) { /* Distribuția structurii antetului ♦/ rezultat vec ptr = (vec ptr) malloc(sizeof(vec rec)); dacă (!rezultat) returnează NULL; /♦ Imposibil de alocat salvare */ rezultat ->len = len; /♦ Alocarea matricei */ dacă (len > ) ( data t *data = (data t *) calloc(len, sizeof(data t)); dacă ('date) { liber((void♦)rezultat); returnează NULL; /♦ Nu se poate aloca salvarea */ } rezultat ->date = date; } altfel rezultat ->date = NULL; returnează rezultatul; } /* * Extrageți elementul vectorial și stocați în destinație * Returnează (în afara limitelor) sau (succes) */ int get vec element (vec ptr v, int index, data t *dest) { dacă (index = v->len) întoarce ; *dest = v->date[index]; întoarcere ; } /♦ Returnează lungimea vectorului */ int vec length(vec j?tr v) { return v->len; } În programul actual din Lista - , tipul de date data t este declarat ca int, float SAU double Partea I Structura și execuția programului /* Implementare cu utilizarea maximă a abstractizării datelor */ void combinei (vecjptr v, data t *dest) { int i; cinci *dest = IDENT; pentru (i = ; i = „A” și& s[i] = „A” și& s[i] = min(x, y); incr(&i, - )) t += pătrat(i); Capitolul Optimizarea performanței programului int low - min (x, y); int mare a max(x, y); pentru (adică scăzut; i ' este timpul necesar pentru a executa versiunea modificată Acest număr va depăși , dacă există o creștere reală Sufixul X este folosit pentru a desemna un astfel de raport, unde factorul , X este exprimat verbal ca „înmulțit cu , ” Modul mai tradițional de a exprima schimbarea relativă ca procent este adecvat dacă modificarea este mică, dar definiția este ambiguă Capitolul , Optimizarea performanței programului Ar trebui să fie x Tww)/Tnou, x (ȚolJ - Ttww) ITou sau altceva? În plus, definiția este mai puțin informativă pentru schimbări radicale Expresia „productivitate îmbunătățită cu %” este mult mai greu de înțeles decât afirmația că productivitatea a crescut cu un factor de , Eliminați referințele inutile la celulele de memorie Codul pentru confluență acumulează valoarea calculată prin operația de combinare în celula indicată de deșt Acest atribut poate fi văzut examinând autocodul de compunere generat pentru bucla compilată, cu numere întregi ca tip de date și înmulțire ca operație de combinare (Listarea - ) În acest cod, registrul %esx indică date, %edx conține valoarea i și %edi indică deșt Listare- LZ-Assvmblerny ѵ ' ' ' - r ; constline : type=INT, OPER=* deșt în %edi, date în %ecx, i în %edx, lungime în %esi L movl(%edi), %eax imull(%ecx, %edx, ), movl %eax, (%edi) inel %edx cmpl %esi, %edx jl L buclă: Citiți *dest %eax Înmulțire cu date [i] Scrie *dest Comparând i:length If a aa >a)a aaa aaa li >>"k b"&ІіgLyіppLa combine : type=INT, OPER = * deșt în %eax, x în %ecx, i în %edx, lungime în %esi L imull(%eax, %edx, ), %ecx inel %edx cmpl %esi, %edx jl L buclă: Înmulțiți x cu date[i] i: comparație de lungime If , mergeți la final neg %eaxElse, neagă-l L :sfârșit: movl %ebp, %esp popi %ebp ret Penalizarea de cicluri este destul de mare De exemplu, dacă precizia predicției ar fi de numai %, atunci procesorul ar pierde o medie de x , = , cicluri per instrucțiune de ramură Chiar și cu precizia predicției de - %, declarată pentru Pentium II și III, se cheltuiește aproximativ ciclu de sincronizare pe fiecare ramură, din cauza predicției incorecte Un studiu al programelor reale arată că ramurile reprezintă aproximativ % din toate instrucțiunile executate în programele tipice de „calcule întregi” (în care datele numerice nu sunt procesate) și de la la % din toate instrucțiunile executate în programele numerice tipice [ ] Astfel, timpul pierdut din cauza procesării ineficiente a ramurilor poate afecta semnificativ performanța procesorului Multe ramuri cu dependențe de date nu pot fi deloc prezise De exemplu, nu există nicio modalitate de a determina dacă un argument pentru o rutină de valoare absolută este pozitiv sau negativ Pentru a îmbunătăți performanța codului care include evaluarea condiționată, multe modele de procesoare au fost extinse pentru a include instrucțiuni de mutare condiționată Aceste comenzi vă permit să implementați o anumită formă de instrucțiuni condiționate fără comenzi de ramificare Cu setul de instrucțiuni IA , au fost adăugate mai multe instrucțiuni de oprire diferite de la procesorul Pentium Pro Aceste comenzi sunt acceptate de toate cele mai recente procesoare Intel și Intel compatibile și efectuează o operație similară codului dacă {COND) x = y; unde y este operandul sursă și ax este operandul destinație Condiția soch, care determină prezența unei operațiuni de copiere, se bazează pe o combinație de valori de cod condiționat, similare cu comenzile de testare și de salt condiționat De exemplu, comanda opavii realizează o copie atunci când codurile de condiție indică o valoare mai mică decât zero Rețineți că primul caracter „ ” al acestei comenzi înseamnă mai puțin decât, iar al doilea caracter este sufixul GAS pentru cuvântul lung Lista arată o implementare a unei valori absolute cu o mutare condiționată Capitolul Optimizarea performanței programului [ Lista cod de valoare absolută cu deplasare condiționată movl (%ebp), %eax movl %eax, %edx negi %edx testl %eax, %eax Obțineți val ca rezultat Copiați în %edx Negați %edx Test val Mutați condiționat %edx în %eax cmovll %edx, %eax Dacă next Măsurătorile arată că funcția list len are un CPE de , care se pretinde a fi o reflectare directă a latenței operației de încărcare Pentru a înțelege acest lucru, luați în considerare autocodul de alcătuire pentru buclă și transformarea primei sale iterații în operații (Tabelul ) — V ,T IM V VM ^ISTING Funcțiile listelor conectate^ - • / typedef struct ELE { struct ELE *next; intdata; } list ele, *list ptr; cinci Capitolul Optimizarea performanței programului int list len (listjptr Îs) { int len = ; nouă pentru (; Оs; Оs =• Оs ->next) len++; return len; } Tabelul Prima iterație Instrucțiuni de asamblare Funcții de funcționare a dispozitivului L : inel %eax movl(%edx) %edx testl %edx, %edx jl L incl%eax O %eax l load(%edx O) %edx l testl %edx l, %edx l cc l jl-taken cc l Iterația Orez Operații de programare pentru funcția List Length Fiecare valoare ulterioară a registrului %edx depinde de rezultatul unei operații de încărcare care are %edx ca operand Pe fig arată planificarea operațiunilor Partea I Structura și execuția programului pentru primele trei iterații ale acestei funcții Se poate observa că întârzierea operației de încărcare limitează CPE-ul la , Întârzierea operațiunilor de salvare Până acum, în toate exemplele, interacțiunea cu memoria a fost realizată numai prin utilizarea operației de încărcare pentru a citi din locația de memorie în registru Echivalentul său, operația de stocare, scrie valoarea unui registru în memorie După cum se arată în tabel , această operație are și o latență nominală de trei cicluri și un timp de ieșire de ciclu Cu toate acestea, comportamentul și interacțiunea sa cu operațiunea de descărcare includ câteva momente „gâdilatoare” Ca și în cazul unei operațiuni de încărcare, în majoritatea cazurilor o operațiune de depozitare poate rula în întregime în modul conductă, începând cu un nou depozit la fiecare ciclu De exemplu, luați în considerare funcțiile prezentate în Lista , care setează elementele matricei deșt cu lungime și la Măsurătorile pentru prima versiune arată un CPE de , Deoarece fiecare iterație necesită o operație de stocare, se înțelege că procesorul poate porni o nouă operațiune de stocare cel puțin la fiecare cicluri Pentru încercări suplimentare, să încercăm să derulăm bucla de opt ori, așa cum se arată în codul pentru array clear Pentru acesta din urmă, CPE-ul este măsurat la , Adică, fiecare iterație necesită aproximativ cicluri și produce opt operațiuni de magazin Astfel, limita optimă a unei noi operații de salvare pe ciclu de sincronizare este practic atinsă I Lista Funcții de resetare a matricei , atunci efectul net este de a seta acea locație la u - Acest exemplu ilustrează un fenomen pe care cartea îl numește dependență de citire-scriere: citirea memoriei depinde de cea mai recentă scriere în memorie Măsurătorile de performanță efectuate au arătat că al doilea exemplu din Fig are un CPE de Dependența de scrieri și citiri face ca procesarea să încetinească Exemplul : write read(&a( ), &a[ ]/ ) Inițial lter Har lter - - - - sau CD - - - Exemplul : write read( a[ ],&a[ ], ) Inițial lter ltar Mar - | | | Orez Cod pentru scrierea și citirea celulelor de memorie împreună cu implementări vizuale Orez Detalii despre funcționarea dispozitivelor de încărcare și salvare Pentru a înțelege modul în care procesorul distinge între aceste două cazuri și de ce unul este mai lent decât celălalt, este necesar să aruncăm o privire mai atentă asupra dispozitivelor de execuție de încărcare și stocare, așa cum se arată în Figura Dispozitivul de salvare conține un buffer de salvare cu adrese și date ale operațiunilor de salvare emise către dispozitivul de salvare, dar care nu a fost încă finalizată deoarece finalizarea trebuie actualizată Capitolul Optimizarea performanței programului cache de date Acest buffer este conceput astfel încât să poată fi efectuate o serie de operațiuni de stocare fără a fi nevoie să așteptați fiecare operație pentru a actualiza memoria cache Când are loc o operație de încărcare, trebuie să verifice intrările din buffer-ul de salvare pentru adresele care se potrivesc Când este găsită o potrivire, memoria cache preia înregistrarea de date corespunzătoare ca rezultat al operației de încărcare Dispozitivul de stocare menține un buffer în așteptare pentru scriere Dispozitivul de încărcare trebuie să își verifice adresa, precum și adresele din dispozitivul magazinului, pentru a detecta dependențele de scriere și citire Autocodul de compunere pentru bucla interioară și transformarea acesteia într-o operație în timpul iterației este prezentat în tabel Tabelul buclă interioară Instrucțiuni de asamblare Funcții de funcționare a dispozitivului L : movl %edx, (%ecx) movl (%ebx), %edx inel %edx deci %eax jne L storeaddr (%ecx) storedata %edx O load (%ebx) %edx la inel %edx la %edx lb deci Șeax O %eax l jnc-taken cc l Rețineți că comanda movl %edx se traduce în două operații: comanda storeaddr calculează adresa pentru operațiunea de stocare, creează o intrare în memoria tampon de stocare și setează câmpul de adresă pentru acea intrare Comanda storedata setează câmpul de date pentru această intrare Deoarece există un singur dispozitiv de stocare, iar operațiunile de stocare sunt procesate în ordinea programului, nu există nicio ambiguitate cu privire la modul în care cele două operațiuni sunt combinate Se va vedea în cele ce urmează că faptul că cele două calcule sunt efectuate independent este important pentru performanța programului Pe fig Figura arată sincronizarea operațiilor primelor două iterații ale scrierii citiți pentru primul exemplu din Figura Linia punctată dintre operațiunile storeaddr și de încărcare indică faptul că operațiunea storeaddr creează o intrare în memoria tampon de stocare, care este verificată ulterior de comanda load Deoarece aceste comenzi nu sunt egale, încărcarea începe să citească datele din cache Chiar dacă operațiunea de stocare nu este finalizată, procesorul poate determina că va afecta o locație de memorie diferită de cea pe care comanda de încărcare încearcă să o citească Acest proces se repetă și în a doua iterație Aici puteți vedea că operația de stocare a datelor trebuie să aștepte ca rezultatul iterației anterioare să fie încărcat și incrementat Cu mult înainte de asta, operația storeaddr și operațiunile de încărcare își pot compara adresele, pot afla că sunt diferite și se pot asigura că începe descărcarea Graficul de calcul arată descărcarea pentru a doua iterație, începând cu doar ciclu după primul Dacă continuăm graficul pentru mai multe iterații, atunci acesta va indica un CPE de , Este evident că Partea / Structura și execuția programului unele constrângeri limitează performanța reală la CPE Iterația Orez Sincronizare de exemplu Iterația Orez Sincronizare de exemplu Pe fig Figura arată sincronizarea operațiilor pentru primele două iterații de scriere citire pentru cazul celui de-al doilea exemplu din Figura Din nou, linia punctată dintre operațiunile storeaddr și de încărcare indică faptul că operația storeaddr creează o intrare în buffer Capitolul Optimizarea performanței programului salvare, care este apoi verificată de operația de încărcare Deoarece aceste operațiuni sunt egale, încărcarea trebuie să aștepte finalizarea operațiunii storeaddr și apoi să preia datele din memoria tampon de stocare Această așteptare este indicată pe grafic printr-o casetă întinsă pentru operația de descărcare În plus, o linie punctată este trasată de la stocarea datelor la operația de încărcare, indicând faptul că rezultatul stocării datelor este transmis la încărcare ca rezultat al acesteia din urmă Momentul acestor operațiuni este arătat pentru a reflecta CPE măsurat la ora Cu toate acestea, nu este complet clar cum ar fi putut apărea o astfel de valoare CPE, așa că se presupune că aceste cifre ar trebui să fie mai ilustrative decât faptice În general, interfața procesor-memorie este una dintre cele mai dificile domenii ale designului procesorului Fără acces la documentație detaliată și instrumente de analiză a mașinii, descrierile comportamentului real pot fi doar ipotetice După cum se arată în aceste două exemple, implementarea operațiunilor de memorie este plină de multe subtilități Cu operațiuni în registre, procesorul poate determina instrucțiuni care îi vor afecta pe alții pe măsură ce sunt decodificate într-o operație Pe de altă parte, cu operațiunile de memorie, procesorul nu poate prezice instrucțiuni a căror execuție va afecta comportamentul altor instrucțiuni înainte de a calcula adresele de încărcare și stocare Deoarece operațiunile de memorie alcătuiesc o mare parte a unui program, subsistemul de memorie este optimizat pentru a rula singur, cu un paralelism mai mare pentru fiecare operație de memorie individuală EXERCIȚIUL Ca un alt exemplu de cod cu potențiale interacțiuni de încărcare/salvare, luați în considerare următoarea funcție de copiere a matricei unice: va in altul: void copy array (int *src, int *dest, int n) { int, i; pentru (i = ; i gcc - -pg prog c -o prog După aceea, programul este executat în modul obișnuit: unix > prog file txt Programul rulează puțin (cu un factor de ) mai lent decât de obicei, altfel singura diferență este că fișierul gmon out este generat GPROF este generat în gmon out pentru analiza datelor unix > gprof prog Prima parte a raportului de profil arată timpul petrecut pe diferite funcții, stocat în ordine descrescătoare De exemplu, Lista arată această parte a raportului pentru primele trei funcții ale programului Fiecare linie reprezintă timpul necesar pentru a apela o anumită funcție Prima coloană arată procentul din timpul total petrecut pe caracteristică OMC Partea I Structura și execuția programului romul arată timpul acumulat petrecut de funcții înainte ca funcția să fie inclusă în această linie A treia coloană arată timpul petrecut pentru o anumită funcție, iar a patra coloană arată de câte ori a fost apelată (excluzând apelurile recursive) În exemplul nostru, funcția de sortare a cuvintelor a fost apelată o singură dată, dar acest apel a durat , secunde, în timp ce funcția inferior a fost apelată de de ori, ceea ce a durat doar , secunde G- | Lista Timp petrecut timp sec sec apeluri ms/apel ms/nume apel , , , , , rt words , , , , , file ele rec , , , , , mai jos A doua parte a raportului de profil arată istoricul apelurilor de funcție Lista - arată istoricul funcției recursive find ele rec , [ ] , , , , find ele rec [ ] , / insert string [ ] + find ele rec [ ] , / save string [ ] / new ele [ ] find ele rec [ ] Acest istoric arată funcțiile care au apelat find eie rec, precum și funcțiile pe care acesta din urmă le-a numit Partea de sus arată că funcția a fost de fapt numită de de ori (afișată ca + ): de de ori singură și de de ori de către funcția insert string (care ea însăși a fost numită de de ori) Funcția find eie rec, la rândul său, a numit alte două funcții, save string și new ele, de de ori fiecare Puteți extrage adesea informații utile despre comportamentul programului din aceste informații despre apel De exemplu, funcția find ele rec este o procedură recursivă care parcurge o listă legată în căutarea unui anumit șir Având în vedere că raportul dintre apelurile recursive și apelurile de nivel superior a fost de , , putem concluziona că de fiecare dată a fost necesar să se uite (scaneze) aproximativ șase elemente Unele proprietăți ale GPROF trebuie remarcate: □ Cronometrarea nu este foarte precisă Se bazează pe o schemă simplă de numărare a intervalelor (descrisă în capitolul ) Pe scurt, programul compilat menține un numărător pentru fiecare funcție, înregistrând timpul petrecut executând acea funcție Sistemul de operare întrerupe execuția programului la un interval de timp de Valorile tipice de variază în interval Capitolul Optimizarea performanței programului nu între , și , ms Se determină apoi funcția pe care programul o executa în momentul întreruperii, iar contorul pentru acea funcție este incrementat cu Desigur, se poate întâmpla ca această funcție tocmai să fi început să se execute și să fie finalizată foarte curând, dar i s-a atribuit statutul de execuție de la ultima întrerupere O altă funcție poate fi executată între cele două întreruperi, deci nu necesită timp □ Pe un interval lung, această schemă funcționează relativ bine Statistic, fiecare funcție ar trebui luată în considerare în funcție de timpul relativ necesar pentru finalizare Cu toate acestea, pentru programele care se execută în mai puțin de o secundă, cifrele trebuie considerate ca fiind foarte aproximative □ Informațiile despre apeluri sunt destul de sigure Programul compilat menține un numărător pentru fiecare combinație de apelant și apelat Contorul corespunzător este incrementat de fiecare dată când procedura este apelată □ În mod implicit, valorile de sincronizare pentru funcțiile bibliotecii nu sunt afișate În schimb, valorile sunt adăugate la valorile de timp necesare pentru a apela funcțiile Utilizarea unui Profiler pentru a gestiona optimizarea Pentru a utiliza profilerul pentru a gestiona optimizarea, a fost creată o aplicație software care include mai multe sarcini și structuri de date Această aplicație citește un fișier text, creează un tabel de cuvinte unice și de câte ori apare fiecare cuvânt, după care cuvintele sunt sortate în ordine descrescătoare pe măsură ce apar Ca punct de plecare, această aplicație a fost lansată cu un fișier care conține operele complete ale lui Shakespeare S-a calculat că Shakespeare a scris un total de de cuvinte, dintre care sunt unice Cel mai răspândit cuvânt a fost articolul englezesc „the”, care apare de de ori, cuvântul „dragoste” apare de de ori, iar „moartea” – de de ori Programul constă din următoarele părți Au fost create o serie de versiuni, începând cu algoritmi simpli pentru diferite părți și apoi înlocuindu-le cu altele mai complexe: Fiecare cuvânt este citit din fișier și convertit în litere mici Versiunea originală a folosit funcția loweri (vezi Figura ), despre care se știe că are complexitate pătratică O funcție hash este aplicată șirului pentru a crea un număr între și - într-un tabel hash cu sloturi Funcția originală a însumat pur și simplu codurile ASCII pentru caracterele modulo Fiecare zonă de stocare hash este organizată ca o listă legată Programul scanează această listă căutând o intrare potrivită Când este detectat, frecvența pentru acest cuvânt este incrementată În caz contrar, este creat un nou element de listă Versiunea originală a efectuat această operație în mod recursiv, inserând elemente noi la sfârșitul listei Partea I Structura și execuția programului După ce tabelul este generat, toate elementele sunt sortate după frecvențe Versiunea originală a folosit sortarea prin inserare Pe fig Figura prezintă rezultatele profilării pentru diferite versiuni ale programului de analiză a frecvenței cuvintelor Pentru fiecare versiune, timpul este împărțit în cinci categorii: Sortați cuvintele după frecvență Vizualizarea listei legate de cuvintele care se potrivesc; se introduce un nou element dacă este necesar Convertiți șirul în format de caractere minuscule Calculul funcției hash Suma tuturor caracteristicilor rămase După cum se arată în fig , versiunea originală durează peste secunde, cea mai mare parte fiind cheltuită pentru sortare Acest lucru nu este surprinzător, deoarece sortarea prin inserție are complexitate pătratică, iar programul sortează aproximativ de valori Orez Profilarea rezultatelor pentru diferite versiuni ale programului de numărare a cuvintelor Capitolul Optimizarea performanței programului În versiunea următoare, sortarea este efectuată folosind funcția de bibliotecă qsort, care se bazează pe algoritmul de sortare rapidă În diagramă, această versiune este etichetată „sortare rapidă” Un algoritm de sortare mai eficient reduce timpul petrecut cu sortarea, făcându-l practic neglijabil, iar timpul total la , secunde A doua parte a diagramei arată timpii pentru versiunea rămasă pe o scară mai detaliată Odată cu sortarea îmbunătățită, se constată că scanarea listelor devine o situație critică Cu presupunerea că ineficiența se datorează structurii recursive a funcției, aceasta este schimbată într-o funcție iterativă În mod surprinzător, timpul de execuție crește la , secunde O privire mai atentă relevă o ușoară discrepanță între cele două funcții din listă Versiunea recursivă a inserat elemente noi la sfârșitul listei, în timp ce versiunea iterativă le-a inserat la început Pentru a maximiza performanța, este necesar ca cuvintele care apar cel mai frecvent să apară mai aproape de începutul listelor În acest fel, funcția va identifica rapid cazurile comune Presupunând că cuvintele din document sunt distribuite uniform, ne putem aștepta ca un cuvânt mai frecvent să apară mai devreme decât un cuvânt mai puțin frecvent Inserând cuvinte noi la sfârșitul listei, prima funcție a căutat să aranjeze cuvintele în ordine descrescătoare, în timp ce a doua funcție a făcut opusul Astfel, se creează o a treia funcție care se uită prin listă și folosește iterația, dar cu inserarea de noi elemente la sfârșitul acestei liste Folosind această versiune, timpul a fost redus la , secunde, ceea ce este puțin mai bun decât versiunea recursivă În continuare, va fi discutată structura tabelului hash Versiunea originală avea doar de găleți (de obicei, numărul de găleți este ales ca număr prim pentru a îmbunătăți capacitatea funcției hash de a distribui uniform cheile între găleți) Pentru un tabel cu de înregistrări, aceasta implică o încărcare medie de / = , Așa se explică de ce se petrece atât de mult timp făcând operațiuni cu liste: procedura de căutare presupune testarea unui număr semnificativ de cuvinte variante Acest lucru explică, de asemenea, sensibilitatea crescută a execuției la ordonarea listelor Numărul de cioburi este apoi crescut la , ceea ce reduce media de încărcare la , Va părea ciudat, dar timpul total de execuție a crescut la , secunde Rezultatele profilării indică faptul că acest timp suplimentar a fost cheltuit în principal pentru conversia de rutină în format șir, deși acest lucru este puțin probabil Valorile timpului de execuție sunt destul de scurte, așa că este greu de așteptat la multă precizie cu aceste valori de sincronizare S-a emis ipoteza că performanța slabă în cazul unui tabel mai mare s-a datorat alegerii greșite a funcției hash O simplă însumare a codurilor de caractere nu oferă o gamă foarte mare de valori și nu diferențiază în funcție de ordinea caracterelor De exemplu, cuvintele „zeu” (zeu) și „câine” (câine) vor fi indexate în locația + + = , deoarece conțin aceleași caractere Cuvântul „dușman” (inamic) va fi, de asemenea, hashing în această locație deoarece + + = Aceasta este o tranziție la o funcție hash folosind operația EXCLUSIVE-OR, cu această versiune etichetată ca un hash îmbunătățit, timpul este redus la , O abordare mai sistematică ar fi Partea I Structura și execuția programului studiu mai atent al distribuției cheilor pe segmente, astfel încât să se apropie de ceea ce ar fi de așteptat dacă funcția hash ar avea o distribuție uniformă a ieșirii În cele din urmă, timpul de execuție a fost redus până la punctul în care jumătate din timp este petrecut făcând conversia în șir Este posibil ca cititorii să fi observat deja că funcția loweri are performanțe foarte slabe, mai ales pentru șiruri lungi Cuvintele din acest document sunt suficient de scurte pentru a evita consecințele dezastruoase ale execuției pătratice; cel mai lung cuvânt "honorificabiliudinitatibus" are de caractere Totuși, mergând la low , notat ca liniar mai mic, oferă performanțe semnificative, cu timpul de execuție general redus la , s Acest exercițiu arată că profilarea codului poate ajuta la reducerea timpului necesar pentru a executa o aplicație software simplă de la , la , , cu un factor de creștere de , Profiler vă ajută să vă concentrați asupra părților cele mai consumatoare de timp ale programului și oferă, de asemenea, informații utile despre structura apelului la procedură Este clar că funcția de profilare este utilă de a avea pe bara de instrumente, dar ar trebui să fie însoțită și de funcții suplimentare Măsurătorile timpului de sincronizare sunt imperfecte, mai ales pentru timpi scurti de execuție (mai puțin de o secundă) Rezultatele se aplică numai pentru anumite date testate De exemplu, dacă funcția inițială este rulată cu date care constau din mai puține șiruri lungi, atunci s-ar constata că treaba de la șir la șir ar deveni un blocaj major de performanță Mai mult, dacă s-ar profila doar documentele cu cuvinte scurte, ar fi foarte greu de identificat factorii ascunși care reduc performanța (de exemplu, performanța pătratică a lowi) În general, profilarea vă poate ajuta să optimizați cazurile tipice presupunând că programul rulează pe date reprezentative, dar trebuie să vă asigurați și că programul va funcționa decent în toate cazurile posibile Aceasta include în principal evitarea utilizării algoritmilor (de exemplu, sortarea prin inserție) și a strategiilor de programare ineficiente (de exemplu, loweri) care oferă performanțe asimptotice slabe legea lui Emdal Gene Amdahl, unul dintre pionierii calculatoarelor, a făcut o observație simplă, dar perspicace despre eficiența îmbunătățirii performanței unei părți a unui sistem Această observație se numește legea lui Emdahl Ideea sa principală este că atunci când se overclockează o parte a sistemului, impactul performanței generale a sistemului depinde atât de semnificația acestei părți a sistemului, cât și de gradul de accelerare Luați în considerare un sistem în care execuția uneia dintre aplicații necesită Told Time Să presupunem că o parte a sistemului necesită o fracțiune de a din acest timp și că productivitatea este crescută cu un factor k Atunci Capitolul Optimizarea performanței programului da, componenta a cerut inițial timp aTok/i și acum necesită timp k Astfel, timpul total de execuție va fi m„„ \u d O- ; i—) rezultat = rezultat * ri returnează rezultatul; nouă } În același timp, numărul CPE pentru această funcție a fost redus de la la (măsurat pe un Intel Pentium III (chiar!) Totuși, grupul de lucru își dorește să obțină rezultate și mai impresionante Unul dintre programatori a auzit despre derularea buclei și a generat următorul cod: int fact u (int n) { int i; int rezultat = ; pentru (i = n; i > ; i-= ) { rezultat = (rezultat * i) * (i- ) } returnează rezultatul; nouă } Partea I Structura și execuția programului Din păcate, grupul de lucru a constatat că pentru unele valori ale argumentului n, acest cod returnează Pentru ce valori ale lui n fact u și fact returnează valori diferite? Arată cum poate fi remediat fact u Rețineți că există un truc special pentru această procedură care implică schimbarea limitei buclei Marcajul fact u nu îmbunătățește performanța Cum să explic? Linia din bucla este modificată Spre uimirea tuturor, performanța măsurată avea acum un CPE de , Cum se explică această îmbunătățire a performanței: rezultat = rezultat * (i * (i- )); La P? ARDE ♦ Folosind o instrucțiune de ramificare condiționată, scrieți autocodul de compunere pentru corpul următoarei instrucțiuni: /* Returnează maximul x și y */ int max (int x, int y) { returnează (x next) suma += Îs ->date; sumă; Autocodul de scriere pentru bucla și conversia primei iterații într-o operație dă următoarele: Instrucțiuni de asamblare Funcții de funcționare a dispozitivului L : addl (%edx), %eax movl (%edx ) tl addl tl, %eax O %eax movl(%edx), %edx load(%edx O) %edx testl %edx, %edx testl %edx l, %edx l cc l jne L jne-luat cc l Desenați un grafic care arată planificarea operațiilor pentru primele trei iterații ale buclei, în stilul fig Amintiți-vă că există un singur dispozitiv de pornire Măsurătorile pentru această funcție dau un CPE de , Acest lucru nu contrazice graficul prezentat în paragraful ? EXERCITIUL ? optsprezece Următoarea funcție este o variantă a funcției sumă listă dată în ynp : int list sum (listjptr Îs) { intsum = ; listjDtr vechi; cinci în timp ce (нs) { vechi = Оs; Оs = ls->next; suma += vechi ->date; } returnsum; } Acest cod este scris astfel încât accesul la memorie pentru a prelua următorul element al listei să aibă loc înainte de accesul la memorie pentru a obține câmpul de date de la elementul curent Autocodul de scriere pentru bucla și conversia primei iterații într-o operație dă următoarele: Partea I Structura și execuția programului Instrucțiuni de asamblare Funcții de funcționare a dispozitivului L : movl %edx, %ex movl(%edx), %edx load(%edx ) %edx addl (%ecx), %eax movl (%edx ) tl addl tl, %eax O %eax testl %edx, %edx testl %edx l, %edx l cc l jne L jne-luat cc l Rețineți că operația de mutare a registrului movl %edx, %ex nu necesită operațiuni pentru implementare Este controlat prin simpla legare a etichetei edx o la registrul %exx, deci următoarea comandă addl (%exx), %eax este convertit pentru a utiliza edx o ca operand sursă Desenați un grafic care arată planificarea operațiilor pentru primele trei iterații ale buclei, în stilul fig Amintiți-vă că există un singur dispozitiv de pornire Măsurătorile pentru această funcție dau un CPE de , Acest lucru nu contrazice graficul prezentat în paragraful ? Cât de mult mai bine folosește această funcție dispozitivul de pornire decât funcția descrisă în Ex ? EXERCIȚIUL ♦ Să presupunem că am primit o sarcină pentru a îmbunătăți performanța unui program constând din trei părți: □ partea A necesită % din timpul total de finalizare; □ partea B necesită % din timpul total de finalizare; □ Partea C necesită % din timpul total de finalizare Se stabilește că pentru USD puteți crește performanța părții B cu un factor de , sau a părții C cu un factor de , Care dintre aceste două opțiuni va maximiza performanța? Soluție de exercițiu SOLUȚIA EXERCITULUI Această sarcină ilustrează unele dintre complexitățile utilizării alias-urilor de memorie După cum se arată în codul comentat mai sus, efectul este de a seta valoarea când xp este zero: Capitolul Optimizarea performanței programului *xp = *xp + *xp; /* x */ *xp = *xp - *xp; /* x- x = */ *xp = *xp - *xp; /*O-O=O*/ Acest exemplu ilustrează presupunerea intuitivă că comportamentul programului este adesea incorect Pare firesc să ne gândim la cazul în care xp și ur sunt exprimate în mod explicit, dar nu se acordă nicio importanță probabilității ca ele să fie egale Erorile și blocările apar adesea din cauza unor condiții de care programatorul nici măcar nu este conștient SOLUȚIA EXERCITULUI Acest exemplu ilustrează relația dintre CPE și timpul până la prima defecțiune Se rezolvă folosind algebră elementară Pentru și SOLUȚIE^EXERCIȚIUL Exercițiul este foarte simplu, dar important în recunoașterea faptului că cele patru instrucțiuni ale buclei for - inițial, test, update și body - sunt executate de un număr diferit de ori Cod min max incr pătrat SOLUȚIE^EXERCIȚIUL După cum este descris în Capitolul , restaurarea diagramei bloc și a operațiunii bazate pe cod (construcție) de la compunerea codului automat în codul C oferă informații utile despre procesul de compilare Codul de mai jos oferă forma datelor generale și operația generală de aspect: void combine px (vec ptr v, data t *dest) { int lungime = vec length(v); int limit = lungime - ; * data t *data = get vec start(v); data t x = IDENT; int i; opt nouă /* Aranjați elemente deodată */ pentru (i = ; i Mărimea blocului (în octeți) m = log (A ) Numărul de biți de adresă fizică (memorie principală) Tabelul Rezumatul opțiunilor de cache Cantități retrase Descrierea parametrului M= '" Număr maxim de adrese de memorie unice = log ( ) Numărul de biți de indicator setați b = log (B) Numărul de biți de deplasare a blocului t = m - ( + b) Numărul de biți de etichetă C = B x E x Dimensiunea memoriei cache (în octeți), excluzând overhead (biți validi și de etichetă) Capitolul EXERCIȚIUL Tabelul arată parametrii pentru un număr de cache diferite Definiți pentru fiecare numărul de seturi de cache (S), de biți de etichetă (/), de biți de indicator ( ) și de biți de deplasare a blocului Cache t C B E S t S I Cache de cartografiere directă Cache-urile sunt grupate în diferite clase în funcție de E, numărul de linii de cache per set Un cache cu un rând pe set (E = ) se numește cache direct-mapped (Figura ) Cache-urile mapate direct sunt cele mai ușor de implementat și de înțeles cum funcționează, așa că vor fi folosite pentru a ilustra unele dintre conceptele generale Set : Setul : |\felid II Tâg I [ Cache block | |\ alid II lâg | | bloc de cache Set S- : | valabil | | lag | | bloc de cache | Orez Cache de cartografiere directă Să presupunem că avem un sistem cu un procesor, fișier de registru, cache L și memorie principală Când CPU execută o instrucțiune care citește cuvântul de memorie w, solicită cuvântul din memoria cache L Dacă aceasta din urmă este o copie în cache a lui w, atunci există o mapare rezultată la memoria cache L , memoria cache preia w rapid și îl returnează la procesor În caz contrar, utilizatorul se confruntă cu o pierdere a memoriei cache, iar CPU trebuie să aștepte ca cache-ul L să solicite o copie a blocului care conține w din memoria principală Când blocul dorit vine din memorie, memoria cache L stochează acel bloc într-unul dintre rândurile sale, extrage cuvântul w din blocul stocat și îl returnează CPU Procesul prin care cache-ul trece prin stabilirea dacă cererea este greșită sau ratată și apoi preluarea cuvântului solicitat constă în trei pași: Alegerea unui set Corzi de potrivire Extragerea cuvintelor Partea I Structura și execuția programului Selectarea unui set în memoria cache de cartografiere directă În acest pas, memoria cache extrage biți pointer setați din centrul adresei pentru ѵv Acești biți sunt interpretați ca un întreg fără semn corespunzător numărului setat Cu alte cuvinte, dacă memoria cache este privită ca o matrice unidimensională de seturi, atunci biții de pointer setați formează un pointer către acea matrice Pe fig Figura prezintă operația de selecție a seturilor pentru un cache mapat înainte În acest exemplu, biții indicatorului setat sunt tratați ca un pointer întreg care selectează setul Set : II lâg II Cache Iosk | Set selectat Set :| [YYY] G^yoP I Ca~cheWock P I IBIT | ^ BITS\SetS- : I ^ Cache nioc~~~] m- Orez Selectarea unui set în memoria cache de cartografiere directă Potrivirea șirurilor într-un cache de cartografiere directă Acum că a fost selectat un set Y, următorul pas este de a determina dacă o copie a cuvântului w este stocată într-una dintre liniile cache conținute în setul / În cazul unui cache mapat direct, acest lucru este simplu și rapid, deoarece există un singur rând pentru set O copie a lui w este conținută în această linie numai dacă bitul valid este setat și eticheta din linia cache se potrivește cu eticheta de la w Seturi selectate: Tag Index set Offset Orez Potrivirea șirurilor și extragerea cuvintelor în cache de cartografiere directă Pe fig Figura arată potrivirea șirului în memoria cache de mapare înainte În acest exemplu, există un singur rând în setul selectat Bitul de valabilitate pentru acest șir este setat, astfel încât biții din etichetă și bloc sunt cunoscuți a fi semnificativi Deoarece biții de etichetă din linia cache se potrivesc cu biții de etichetă din adresă, știm că o copie a cuvântului dorit este într-adevăr stocată în acea linie Alții Capitolul Cu alte cuvinte, există un acces efectiv la cache Pe de altă parte, dacă bitul valid nu a fost setat sau biții de etichetă nu se potrivesc, atunci ar avea loc o pierdere a memoriei cache Extragerea cuvintelor în cache-urile mapate direct Având în vedere o lovitură de cache, se știe că w se află undeva în bloc Acest ultim pas determină unde începe cuvântul dorit în bloc După cum se arată în fig , biții de deplasare bloc oferă o deplasare a primului octet al cuvântului dorit La fel ca reprezentarea unui cache ca o matrice de șiruri de caractere, un bloc poate fi gândit ca o matrice de octeți, iar un offset de octeți poate fi gândit ca un pointer către acea matrice În exemplu, biții de deplasare a blocului indică faptul că copia lui w începe la octetul din bloc (se presupune că cuvintele au o lungime de octeți) Evacuarea liniei în cazul erorilor de memorie cache mapate direct Când are loc o pierdere a memoriei cache, blocul solicitat trebuie preluat de la următorul nivel al ierarhiei de memorie și noul bloc trebuie să fie stocat într-una dintre liniile de cache ale setului indicat de biții pointer setați În general, dacă memoria cache este umplută cu linii de cache valide, atunci una dintre liniile existente trebuie evacuată Pentru un cache mapat direct, în care fiecare set este format dintr-un singur rând, strategia de înlocuire este banală: rândul curent este înlocuit cu rândul nou selectat Asamblare finală: cache cu acces direct în acțiune Mecanismele pe care le folosește un cache pentru a selecta seturi și a identifica rândurile sunt remarcabil de simple Trebuie să fie, deoarece hardware-ul trebuie să le execute în doar câteva nanosecunde Cu toate acestea, acest tip de manipulare a biților poate părea simplă pentru o mașină, dar nu și pentru o persoană Un exemplu va ajuta la clarificarea procesului Să presupunem că avem un cache cu acces direct, descris ca (S, £, B, m) = ( , , , ) Cu alte cuvinte, acest cache are patru seturi cu câte o linie fiecare, octeți pe bloc și adrese de biți De asemenea, presupuneți că fiecare cuvânt are un octet Astfel de ipoteze, desigur, sunt nerealiste, dar vor ajuta la simplificarea cât mai mult posibil a exemplului Când studiem un cache, numerotarea întregului spațiu de adrese și împărțirea biților, așa cum sa făcut în Tabelul , poate deveni o modalitate foarte informativă pentru exemplul pe biți Există câteva lucruri interesante de remarcat despre spațiul numerotat: □ Concatenarea biților de etichetă și a biților pointer identifică în mod unic fiecare bloc de memorie De exemplu, blocul este format din adresele și , blocul este format din adresele și , blocul este format din adresele și și așa mai departe Partea I Structura și execuția programului □ Deoarece există opt blocuri de memorie, dar numai patru seturi de cache, blocurile multiple sunt asociate cu același set de memorie cache (adică, au același indicator de set) De exemplu, blocurile și mapează pentru a seta , blocurile și ambele mapează pentru a seta și așa mai departe □ Blocurile care se mapează la același set de cache sunt identificate în mod unic printr-o etichetă De exemplu, blocul are bitul de etichetă și blocul are bitul de etichetă , blocul are bitul de etichetă , în timp ce blocul are bitul de etichetă Tabelul Spațiu de adrese cache mapat înainte de biți Biți de adresă Biți de etichetă de adresă Biți Biți de deplasare Număr bloc (zecimal) (/= ) indicator (s- ) (L- ) (zecimal) Eu și Să simulăm memoria cache în acțiune în timpul secvenței de citire a procesorului Rețineți că acest exemplu presupune că CPU citește cuvinte pe un singur octet Deși acest tip de simulare manuală este destul de plictisitoare și cititorul va dori să o ignore, autorii cred că va fi dificil de înțeles cum funcționează memoria cache fără cel puțin câteva astfel de exemple Capitolul Inițial, memoria cache este goală, fiecare bit valid este (Tabelul ) Tabelul Spațiu cache inițial mapat direct Setați blocul etichetei de încredere | | bloc [ ] douăzeci treizeci Fiecare rând din tabel reprezintă o linie cache Prima coloană indică setul căruia îi aparține rândul, dar rețineți că această coloană este doar pentru comoditate și nu este o parte reală a memoriei cache Cele patru coloane rămase reprezintă biții reali din fiecare linie de cache Să vedem ce se întâmplă când CPU execută o secvență de operații de citire: I Citirea cuvântului la adresa (Tabelul ) Deoarece bitul valid pentru setul reprezintă , apare o pierdere a memoriei cache Cache-ul preia blocul (sau cache-ul de nivel inferior) din memorie și îl stochează în setul Cache-ul returnează apoi m[ ] (conținutul locației de memorie ) din blocul al liniei cache nou selectate Tabelul Citind cuvântul de la adresa O Setare etichetă de încredere bloc [ ] bloc [ ] t[ ] t[ ] douăzeci treizeci Citirea cuvântului de la adresa Acesta este o lovitură de cache eficientă Acesta din urmă returnează imediat m[ ] din blocul al liniei cache Starea cache-ului nu se schimbă Citirea cuvântului de la adresa (Tabelul ) Deoarece linia cache din setul este validă, există o pierdere de cache Cache-ul încarcă blocul în setul și returnează m[ ] din blocul al noii linii de cache Citirea cuvântului din adresa (Tabelul ) Cache miss Linia cache din setul este validă, dar etichetele nu se potrivesc Cache-ul încarcă blocul în setul (înlocuind linia rămasă acolo după citirea adresei ) și returnează m[ ] din blocul al noii linii cache Partea I Structura și execuția programului Tabelul Citiți cuvântul la adresa Setare etichetă de încredere bloc [ ] bloc [ ] w[ ] t[ ] t[ ] t[ ] treizeci Tabelul Citiți cuvântul de la adresa Setarea etichetei de încredere bloc [ ] bloc | t[ ] t[ ] t[ ] t[ ] treizeci Citirea cuvântului la adresa (Tabelul ) Aceasta este o altă pierdere de cache, din cauza faptului nefericit că blocul a fost înlocuit în timpul unui acces anterior la adresa Acest tip de ratare, atunci când există mult spațiu liber în cache, dar trebuie să alternați accesele la blocurile mapate la același set, este un exemplu de pierdere a conflictului Tabelul cache miss Setați blocul etichetei de încredere( ) bloc[ ] t[ ] t[ ] t[ ] t[ ] treizeci Conflictul lipsește în memoria cache mapată directă În programele reale, erorile de conflict sunt destul de frecvente și pot cauza probleme serioase de performanță Erorile de conflict în cache-urile mapate directe apar de obicei atunci când programele accesează matrice care au puteri de două dimensiuni De exemplu, luați în considerare o funcție care calculează produsul interior a doi vectori (Listarea ) Capitolul float dotprod (float x[ ], float y[ ]) { sumă float = , int i; cinci b pentru (i = ; i #include "fcyc h" /* Proceduri de rutină pentru sincronizarea circuitului de măsurare după coeficient LA*/ #include „clock h” /* Rutine de contor de cicluri */ #define MINBYTES ( " ) /* Mărimea setului de lucru variază de la KB */ #define MAXBYTES ( " ) /* Mărimea setului de lucru variază de la MB */ #define MAXSTRIDE /* Pașii variază de la la */ #define MAXELEMS MAXBYTES /sizeof (int) nouă int date [MAXELEMS]; /* Matrice de urmărit * / int main() { int dimensiune; /* Dimensiunea setului de lucru (în octeți) */ int pas; /* Pas (în elemente de matrice) */ dublu Mhz; /* Frecvența ceasului */ init data(date, MAXELEMS); /* Inițializarea fiecărui element în date de până la */ Mhz=mhz( ); /• k Definiția frecvenței ceasului */ pentru (dimensiune = MAXBYTES; dimensiune >= MINBYTES; dimensiune "= ) { pentru (pas = ; pas gcc - -g -o p main c swap c Orez Figura ilustrează acțiunile dispecerului la traducerea unui exemplu de program dintr-un fișier sursă ASCII într-un fișier obiect executabil Dacă doriți să urmați acești pași direct, rulați gcc cu opțiunea -v Dispecerul va rula mai întâi preprocesorul C (cpp), care traduce fișierul sursă C main c în fișierul intermediar ASCII main eu: cpp [alte argumente] main c /trap/main i principal cu swap din FILES SOURCE p Legat fișiere obiect executabile Orez Legătura statică Apoi, dispecerul rulează compilatorul C (cci), care traduce main i într-un fișier de asamblare ASCII main s cci /trap/main i main c - [alte argumente] -o /tmp/main s Capitolul : Editarea legăturilor Apoi, dispecerul rulează asamblatorul (as), care traduce main s într-un fișier obiect relocabil main o: ca [alte argumente] -o /tmp/main o /tmp/main s Același proces are loc în dispecer atunci când este generat swap o În cele din urmă, rulează programul linker ia, care combină main o și swap o, împreună cu fișierele obiect de sistem necesare, pentru a crea un fișier obiect p executabil: ld -o p [fișiere obiect de sistem și argumente] /tmp/main o /tmp/swap o Pentru a rula programul executabil p, introducem numele acestuia pe tastatură la linia de comandă a shell-ului Unix: unix> /p Procesorul de comenzi apelează o funcție din sistemul de operare numită încărcător, care copiază codul programului și datele fișierului executabil p în memorie și apoi transferă controlul la începutul programului Legătura statică Un linker static, cum ar fi programul Unix ld, ia ca intrare un set de fișiere obiect relocabile și opțiuni de linie de comandă și generează un fișier obiect executabil legat complet care poate fi încărcat și rulat ca ieșire Fișierele obiect reutilizabile de intrare conțin diferite secțiuni de cod de program și date Comenzile sunt într-o secțiune, variabilele globale inițializate sunt într-o altă secțiune, iar variabilele neinițializate sunt într-o a treia secțiune Pentru a construi un modul executabil, linkerul trebuie să parcurgă doi pași de bază Despre permisiunea de conectare Fișierele obiect conțin definiții ale numelor și referințe la nume Scopul rezoluției legăturilor este de a asocia cu acuratețe fiecare referință la un nume cu o definiție unică de nume □ Mișcare Compilatorii și asamblatorii generează cod și secțiuni de date începând cu adresa zero Linker-ul mută aceste secțiuni, legând fiecare definiție de nume la o adresă de memorie și schimbând toate referințele la acele nume pentru a indica acea adresă de memorie Următoarele secțiuni explică aceste proceduri mai detaliat Pe măsură ce începeți să citiți acest material, țineți cont de câteva fapte de bază despre linkeri: Un fișier obiect este pur și simplu o colecție de blocuri de octeți Unele dintre aceste blocuri conțin cod de program, altele conțin date de program, iar altele conțin structuri de date care controlează linker-ul și încărcătorul Linker-ul leagă blocuri între ele, selectează adresele de rulare pentru acele blocuri și modifică diverse adrese din blocurile de date și codul programului Editorii de linkuri au o înțelegere minimă a mașinii țintă Partea a II-a Executarea programelor în sistem Compilatorii și asamblatorii care au generat fișierele obiect au făcut deja multă muncă Fișiere obiect Fișierele obiect apar în una dintre cele trei forme: Fișier obiect relocabil Conține cod binar și date care pot fi combinate în timpul compilării cu alte fișiere obiect relocabile pentru a crea un fișier obiect executabil Fișier obiect executabil (absolut) - conține cod binar și date sub formă care pot fi copiate direct în memorie și lansate pentru execuție Un fișier obiect partajat este un tip special de fișier obiect relocabil care poate fi încărcat în memorie și legat dinamic la alte module, fie în timpul încărcării, fie în timpul rulării Compilatorii și asamblatorii generează fișiere obiect relocabile (inclusiv fișiere obiect partajate) Editorii de linkuri generează fișiere obiect executabile Din punct de vedere tehnic, un modul obiect este o secvență de octeți, iar un fișier obiect este un modul obiect stocat într-un fișier de pe disc Cu toate acestea, vom folosi acești termeni în mod interschimbabil Formatele fișierelor obiect variază de la sistem la sistem Primele sisteme Unix de la Beli Labs au folosit formatul a out Până în prezent, modulele executabile sunt încă numite a out Versiunile timpurii ale Unix System V foloseau formatul COFF (Cot-mon Object File) Windows folosește o variantă de COFF numită formatul PE (Portable Executable) Sistemele Unix moderne, variantele BSD ale Unix și Sun Solaris folosesc Unix ELF (Format Executable și Linkable) Deși ne vom concentra pe ELF, conceptele de bază vor fi aceleași indiferent de formatul specific Fișiere obiect relocabile Pe fig Figura prezintă formatul unui fișier obiect ELF relocabil tipic Antetul ELF începe cu o secvență de octeți care descrie dimensiunea cuvântului și ordonarea octeților pentru sistemul care a generat fișierul Restul antetului ELF conține informații care permit linkerului să analizeze și să interpreteze fișierul obiect Acestea includ dimensiunea antetului ELF, tipul de fișier obiect (relocabil, executabil sau partajat), tipul de mașină (de exemplu, IA ), decalajul tabelului antet de secțiune din fișier, dimensiunea și numărul de intrări în tabelul antet secțiunii Adresele și dimensiunile diferitelor secțiuni sunt descrise în tabelul antet secțiunii, care conține o intrare cu dimensiune fixă pentru fiecare secțiune din fișierul obiect Capitolul Editarea legăturilor Descrie fișierul I object ț Secțiuni « Antet ELF text rodata date bss symtab rel text date rel depanare linia strtab Secțiunea antet tabelului O Orez Un fișier obiect ELF relocabil tipic Secțiunile în sine sunt între antetul ELF și tabelul antet secțiunii Un fișier obiect ELF relocabil tipic conține următoarele secțiuni: □ text - codul mașină al programului compilat; □ rod și ta sunt date numai în citire, cum ar fi șirurile de format în instrucțiunile prințf și tabelele de salt pentru instrucțiunile switch (vezi exercițiul ); Despre data - variabile C globale initializate Variabilele locale C sunt alocate pe stivă în timpul execuției și nu apar nici în secțiunea data, nici în secțiunea bss; Despre bss - variabile globale C neinițializate Această secțiune nu ocupă spațiu real în fișierul obiect, este doar un „deținător de spațiu” Formatele fișierelor obiect diferă pentru variabilele inițializate și neinițializate Acest lucru se face pentru a conserva memorie: variabilele neinițializate nu ar trebui să ocupe de fapt spațiu în fișierul obiect de pe disc; □ symtab - tabel de nume (tabel de identificatori) cu informații despre funcții și variabile globale care sunt definite în program și către care există legături Unii programatori cred în mod eronat că, pentru a obține informații din tabelul de nume, programul trebuie compilat cu opțiunea -d De fapt, fiecare fișier obiect relocabil are un tabel de nume în symtab Totuși, spre deosebire de tabelul de simboluri din compilator, tabelul de nume symtab nu conține intrări pentru variabilele locale; Despre rel text O listă de adrese din secțiunea text care ar trebui modificată atunci când linkerul leagă acest fișier obiect cu altele În general, orice comandă care apelează o funcție externă sau se referă la o variabilă globală trebuie modificată Pe de altă parte, comenzile care apelează funcții locale nu ar trebui modificate Urs Partea a II-a Executarea programelor în sistem ceea ce înseamnă că informațiile de relocare nu sunt necesare în fișierele obiect executabile și sunt de obicei omise, cu excepția cazului în care utilizatorul îi cere linkerului să le includă în mod explicit; □ rel data - Informații de relocare pentru fiecare variabilă globală care este referită sau definită în acest modul În general, fiecare variabilă globală inițializată a cărei valoare inițială este adresa unei variabile globale sau a unei funcții externe trebuie modificată; □ debug - Un tabel cu nume de depanare cu intrări pentru variabilele locale și definițiile tipului dintr-un program dat, variabile globale la care se face referire sau definite într-un program dat și un fișier sursă C Ele sunt prezente numai dacă managerul compilatorului este invocat cu opțiunea -d; □ line - un tabel de corespondență între numerele de linii din programul C sursă și instrucțiunile de cod mașină din secțiunea text Este prezent dacă managerul compilatorului este invocat cu opțiunea -d; □ strtab - Tabel de șiruri pentru tabelele de nume din secțiunile symtab și debug și pentru secțiunea de nume din secțiunea antet Tabelul de șiruri este o secvență de șiruri de caractere, fiecare cu un caracter nul la sfârșit Numele datelor neinițializate Utilizarea termenului bss pentru a se referi la date neinițializate este larg răspândită A fost inițial (circa ) un acronim pentru instrucțiunea de asamblare IBM Block Storage Start și acest acronim a supraviețuit O modalitate ușoară de a vă aminti diferența dintre secțiunile data și bss este să vă gândiți la „bss” ca prescurtare pentru „Better Save Space!” (salvați memoria acolo unde este posibil) Identificatori și tabele de nume Fiecare modul de obiect relocabil m are un tabel de nume care conține informații despre toate numele definite la care se face referire în m Din punctul de vedere al linkerului, există trei tipuri diferite de nume: □ Simboluri globale, care sunt definite în modulul t și pot fi referite din alte module Numele globale de linker corespund funcțiilor C non-statice, iar variabilele globale sunt cele definite fără atributul static C, □ Numele globale la care se face referire în modulul m dar definite în alt modul se numesc extern și aparțin funcțiilor și variabilelor C care sunt definite în alte module □ Nume locale (simbol local) care sunt definite și referite exclusiv în modulul i Unele nume de editor local Capitolul , Editarea legăturilor legăturile corespund funcțiilor C și variabilelor globale care sunt definite cu atributul static Aceste nume sunt vizibile în întregul modul /u, dar nu pot fi referite din alte module Aceste* secțiuni din fișierul obiect și numele fișierului sursă primesc, de asemenea, un nume local Este important să înțelegeți că numele locale de linker nu sunt aceleași cu variabilele locale ale programului Tabelul de nume din symtab nu conține nume care să corespundă variabilelor locale non-statice ale programului Acestea din urmă sunt alocate pe stivă în timpul execuției și nu prezintă interes pentru linker Interesant este că variabilele de procedură locală definite în C cu atributul static nu sunt plasate pe stivă Pentru fiecare astfel de definiție, compilatorul alocă spațiu în data sau bss și generează un nume de linker local în tabelul de nume cu un identificator unic De exemplu, să presupunem că o pereche de funcții din același modul (Listarea - ) definește o variabilă locală statică X Lista Definiția unei variabile statice cinci opt nouă unsprezece int { int revenire statică g() revenire statică int X X; int X x; = ; f O În acest caz, compilatorul alocă spațiu în bss pentru două numere întregi și transmite două nume locale de linker identice, neidentice, la asamblator În schimb, puteți utiliza x i în funcția f pentru a defini variabila și x în funcția g Ascunderea numelor de variabile și funcții Pentru a ascunde declarațiile de variabile și funcții în module, programatorii C folosesc atributul static, la fel cum Java și C++ ar folosi declarații publice și private Fișierele sursă C joacă rolul de module Fiecare variabilă sau funcție globală declarată cu atributul static este privată în acest modul În mod similar, fiecare variabilă sau funcție globală declarată fără un atribut static este publică și accesibilă din orice alte module Practica de programare a arătat că este oportună protejarea variabilelor și funcțiilor cu atributul static ori de câte ori este posibil Partea a II-a Executarea programelor în sistem Tabelele de nume compilate de asamblatori folosesc numele transmise de compilator în fișierul de asamblare Tabelul de nume ELF este conținut în secțiunea symtab Conține o serie de intrări Lista arată formatul fiecărei intrări typedef struct { intname; /* offset tabel de rânduri */ valoare int; /* offset secțiune sau adresa VM */ int dimensiune; /* dimensiunea obiectului în octeți */ Tip de caractere: , /* date, funcție, secțiune sau nume de fișier sursă */ legare: ; /* local sau global ( biți) */ caractere rezervate; /* nefolosit */ secțiune de caractere; /* index antet secțiuni, ABS, UNDEF sau COMMON */ nouă } Simbol Elf; Variabila pasche este offset-ul (în octeți) din tabelul de șiruri care indică șirul de nume terminat cu nul, valoare este adresa numelui Pentru modulele relocabile, valoarea este decalajul de la începutul secțiunii în care este definit obiectul Pentru fișierele obiect executabile, valoarea este adresa absolută a timpului de execuție Dimensiunea variabilă este dimensiunea (în octeți) a obiectului, tipul este de obicei fie date, fie o funcție Tabelul de nume poate conține, de asemenea, intrări pentru o singură secțiune și pentru numele căii fișierului sursă al programului Astfel, există diverse obiecte de acest tip Câmpul de legare indică dacă numele este local sau global Fiecare nume este asociat cu o anumită secțiune a fișierului obiect, notat cu câmpul de secțiune, care este un index în tabelul antet secțiunii Există trei secțiuni speciale care nu au intrări în tabelul antetului secțiunii: ABS - pentru nume care nu pot fi mutate UNDEF - pentru nume nedefinite (care sunt referite în acest modul de obiect, dar care sunt definite în altă parte) COMUNE - pentru obiectele de date neinițializate care nu au fost încă alocate Pentru numele COMUNE, câmpul de valoare satisface cerința de aliniere iar mărimea dă dimensiunea minimă Luați, de exemplu, ultimele trei intrări din tabelul de nume pentru main o afișate de utilitarul GNU READELF Primele opt intrări, care nu sunt afișate, sunt nume locale utilizate intern de linker În tabel În Figura - , vedem intrarea pentru a defini numele global buf, un obiect de octeți situat la offset zero (adică valoarea = ) în secțiunea data Este urmată, prin definiție, de numele global main, o funcție de octeți situată la offset zero în secțiunea text Ultima intrare se referă la referința pentru schimbul de nume extern Un index de indică secțiunea text, iar un index de indică secțiunea data Capitolul Editarea legăturilor Tabelul Introducerea numelui global al modulului principal Număr Valoare Mărime Tip Relație Offset Index Nume : OBIECTUL GLOBAL buf : FUNC GLOBAL și în : NOTTYPE GLOBAL UND swap Iată intrările similare din tabelul de nume pentru swap o (Tabelul ) Tabelul Intrări de nume globale ale modulului obiect Număr Valoare Mărime Tip Relație Offset Index Nume : OBIECTUL GLOBAL bufpO : NOTTYPE GLOBAL UND buf : FUNC GLOBAL schimb : OBJECT GLOBAL UND bufpl În primul rând, vedem o intrare pentru a defini numele global bufpO, care reprezintă un obiect inițializat de octeți situat în secțiunea dat a la offset Următorul nume este asociat cu o referință la numele extern buf în codul de inițializare pentru bufpO Aceasta este urmată de schimbarea numelui global, o funcție de de octeți în text la offset Ultima intrare este numele global bufpi, un obiect de date neinițializat de octeți (cu aliniere pe octeți) care va fi în cele din urmă alocat ca un obiect bss la editarea legăturilor acestui modul EXERCIȚIUL Această sarcină este legată de modulul swap o din lista Pentru fiecare nume definit sau referit în swap o, specificați dacă va avea de fapt o intrare în secțiunea symtab a tabelului de nume din modulul swap o Dacă da, atunci specificați modulul în care este definit numele (swap o sau main o), tipul numelui (local, global sau extern) și secțiunea ( text, data sau bss) pe care o ocupă în acest modul Intrare nume Tip de nume În ce modul este definită Secțiunea buf bufpo bufpl schimb temp Partea a II-a Executarea programelor în sistem Rezoluția legăturii Linker-ul rezolvă referințele de nume prin asocierea fiecărei legături cu o definiție de nume din tabelul de nume al fișierelor sale obiect relocabile de intrare Rezolvarea referințelor la nume locale care sunt definite în același modul ca referința în sine este simplă Compilatorul permite doar o singură definiție a fiecărui nume local dintr-un modul Compilatorul se asigură, de asemenea, că numele variabilelor statice locale pe care le primește linkerul sunt unice Cu toate acestea, rezolvarea referințelor la nume globale este mai complexă Când compilatorul întâlnește un nume (variabilă sau funcție) care nu este definit în modulul curent, presupune că numele este definit într-un alt modul, generează o intrare în tabelul numelor de linker și o lasă pentru procesare ulterioară de către linker Dacă linkerul nu poate găsi o definiție pentru numele la care face referire în vreunul dintre modulele sale de intrare, acesta afișează un mesaj de eroare (adesea criptic) și iese De exemplu, să încercăm să compilam și să edităm legăturile pentru codul din Lista pe o mașină Linux: :rListing- ' ?Imageidlyakhkoypi^~-D void foo(void); int main() { foo(); returnează ; } Compilatorul va rula fără îndoială, dar linkerul se va închide după ce nu reușește să rezolve referința la foo: unix> gcc -Wall - -o linkerror linkerror c /tmp/ccSz uti o: În funcția 'main*: (în funcția 'main') /tmp/ccSz uti o( text+ x ): referință nedefinită la „foo” collect : Id-ul a returnat stare de ieșire Rezolvarea referințelor la nume globale este, de asemenea, dificilă, deoarece același nume poate fi, în principiu, definit în mai multe fișiere obiect diferite Într-un astfel de caz, linkerul trebuie fie să semnaleze o eroare, fie să selecteze cumva una dintre definiții și să le renunțe pe celelalte Abordarea adoptată pe sistemele Unix implică o colaborare strânsă între compilator, asamblator și linker și, dacă este programată neglijent, poate duce la unele erori „inexplicabile” Capitolul : Editarea legăturilor Deformarea numelui de către linker în C++ și Java Atât C++ cât și Java permit metode supraîncărcate care au același identificator în codul sursă, dar diferă în listele de parametri Întrebarea devine atunci, cum comunică linkerul că aceste funcții supraîncărcate nu sunt identice? Mecanismul funcțiilor supraîncărcate funcționează în C++ și Java, deoarece compilatorul recodifică identificatorul fiecărei metode unice, având în vedere combinația listei de parametri ai acesteia, într-un nume unic pentru linker Acest proces de codificare este așa-numita deformare a identificatorului numelui, iar procesul invers este restaurarea (demanglarea) identificatorului numelui Interesant este că limbajele C++ și Java folosesc scheme compatibile de identificare a numelui Un identificator de clasă alterat constă dintr-un număr întreg care reprezintă numărul de caractere din identificator, urmat de identificatorul original De exemplu, clasa Foo este codificată ca Foo Metoda este codificată ca identificatorul inițial al metodei, urmat de un caracter de subliniere, urmat de un identificator de clasă alterat, urmat de codificări cu o singură literă ale fiecărui argument De exemplu, Foo: :bar (int, long) este codificat ca bar Fooil Scheme similare sunt folosite pentru a distorsiona global identificatori de centură și șablon Referințe globale definite multiple În momentul compilării, compilatorul transmite fiecare nume global asamblatorului, fie puternic definit (puternic), fie slab definit (slab), iar asamblatorul codifică implicit aceste informații în tabelul de nume al fișierului obiect care este mutat Funcțiile și variabilele globale inițializate primesc nume strict definite Variabilele globale neinițializate primesc nume slab definite Pentru programul exemplu din Lista - , buf, bufpO, main și swap sunt nume bine definite; bufpl este un nume vag definit Pe baza acestor concepte de nume puternic definite și slab definite, linkerii Unix folosesc următoarele reguli pentru a gestiona nume mai multe calificate: Nu sunt permise mai multe nume strict definite Dacă există un nume puternic definit și mai multe nume slab definite, este selectat numele puternic definit Dacă există mai multe nume slab definite, se alege oricare dintre numele slab definite Să presupunem că vrem să compilam și să legăm următoarele două module C (Listingurile și ) Partea a II-a Executarea programelor în sistem /* prost c */ /* barl c */ int main() int main() { { returnează ; returnează ; } } În acest caz, linkerul generează un mesaj de eroare deoarece numele principal bine definit este definit de mai multe ori (regula ): unix> gcc fool c barl c /tmp/cca o: În funcția „main”: (în funcția „main”) /tmp/cca o( text+OxO): definiție multiplă a „principal” /tmp/cca o( text+OxO): mai întâi definit aici În mod similar, linkerul generează un mesaj de eroare pentru următoarele module, deoarece numele puternic specificat x este definit de două ori (regula ): isting ; Exemplul de utilizare a regulii T - r ' i /* foo c */ /* bar c */ int x = ; int x = ; int main() void f() { { returnează ; } } Cu toate acestea, dacă variabila x nu este inițializată într-unul dintre module, atunci linkerul va selecta cu ușurință un nume strict definit definit în altul (regula ): '^^T|«n^ ; /|Іexemplu;utilizați^Yo'v n^іА'іregula ± • void f(void); int x = ; cinci int main() opt { f(); printf(”x = %d\n”, x); returnează ; } /* bar c */ int x; void f() { x = ; } Capitolul Editarea legăturilor În timpul execuției, funcția f modifică valoarea lui x de la la , ceea ce ar putea fi o surpriză neplăcută pentru autorul funcției principale Rețineți că linkerul de obicei nu răspunde când întâlnește mai multe definiții x diferite: unix> gcc -o foobar foo c bar c unix> /foobar x= Același lucru se poate întâmpla dacă există două definiții slabe ale lui x (regula ): /* foo c */ /♦ bar c */ #include int x; void f(void); void f() intx; cinci { x= ; int main() } opt { x = ; f ; printf("x = %d\n", x); returnează ; } Aplicarea regulilor și poate duce la unele erori de rulare insidioase care sunt greu de înțeles de un programator neglijent, mai ales dacă redefinirile unui nume sunt de diferite tipuri Luați în considerare următorul exemplu, unde x este definit ca int într-un modul și dublu în altul: ^Listing T ; /* foo c */ #include void f(void); int x = ; int main() nouă { f(); printf("x = x%x y = xz y); /* bar c */ x dublu; void f() cinci { int y = ; } x = - , ; x%x\n", Partea a II-a Executarea programelor în sistem returnează ; paisprezece } Pe o mașină IA care rulează Linux, dublurile sunt de octeți, iar numerele întregi sunt de octeți Astfel, atribuirea x = - pe linia din bar c va modifica valorile din adresele de memorie pentru variabilele x și y (liniile și din fooS c) atunci când se reprezintă o valoare negativă ca date în virgulă mobilă cu precizie dublă ! linux > gcc -o foobar foo c bar c linux> /foobar x = x y = x Acesta este un bug subtil și periculos, mai ales că trece neobservat fără avertisment din partea sistemului de compilare De obicei, apare puțin mai târziu - în timpul execuției programului, departe de locul în care a apărut eroarea În sistemele mari cu sute de module, erorile de acest fel sunt extrem de greu de remediat, mai ales că mulți programatori nu știu cum funcționează linkerii Dacă aveți îndoieli, invocați un editor de hartă de taste, cum ar fi gcc -warn -common, pentru a indica faptul că ar trebui să fie afișat un mesaj de avertizare la rezolvarea mai multor legături globale EXERCIȚII Pentru acest exercițiu, vom presupune că notația REF(xi) -> DEF(xk) înseamnă că linkerul asociază o referință arbitrară la numele x din modulul i cu definiția lui x din modulul k Pentru fiecare exemplu ulterior, utilizați această notație pentru a arăta modul în care linkerul ar rezolva referințele la un nume definit multiplu în fiecare modul Dacă există o eroare de timp de editare a linkului (regula ), scrieți „EROARE” Dacă editorul de linkuri alege în mod arbitrar una dintre definiții (regula ), scrieți „NECUNOSCUT” unu /* Modulul */ /* Modulul */ int main() int main; { int p () } { } (a) REF(principal l) > DEF( ) (b) REF(principal ) > DEF( ) /* Modulul */ void main() { } } /* Modulul */ int main = ; int p () { Secțiunea Editarea legăturilor (a) REF(principal l) > DEF( ) (b) REF(principal ) > DEF( ) /* Modulul */ int x; void principal; { } (a) REF(xl) > DEF( ) (b) REF(x ) > DEF( ) /★ Modulul */ dublu x = , ; int p () { } Conectarea cu biblioteci statice Până acum, am presupus că linkerul citește o colecție de fișiere obiect relocabile și le leagă împreună într-un executabil de ieșire Aproape toate sistemele de compilare oferă un mecanism pentru a împacheta modulele obiect asociate într-un singur fișier, numit bibliotecă statică, care poate fi apoi transmisă ca intrare la un linker Când linkerul leagă executabilul de ieșire, acesta copiază numai acele module obiect din bibliotecă la care se face referire din aplicație De ce conceptul de biblioteci este susținut sistemic? Luați în considerare limbajul ANSI C, care definește o mare varietate de operații standard de intrare/ieșire, operații cu șir și funcții matematice întregi, cum ar fi atoi, prințf, scanf, strcpy și aleatoriu Ele sunt disponibile în biblioteca libc a pentru fiecare program C ANSI C definește, de asemenea, în biblioteca libm a o gamă largă de funcții matematice pentru operații în virgulă mobilă, cum ar fi sin, cos și sqrt Să aruncăm o privire asupra diferitelor abordări pe care dezvoltatorii de compilatoare le-ar putea lua pentru a oferi utilizatorilor acces la aceste funcții fără a recurge la utilizarea bibliotecilor statice Prima abordare posibilă ar fi construirea unui compilator care recunoaște cererile pentru funcții standard și generează direct codul corespunzător Pascal, care prevede un set mic de funcții standard, adoptă această abordare, dar este inacceptabilă pentru C, din cauza prezenței unui număr mare de funcții standard definite de standardul acestui limbaj Adoptarea unei astfel de abordări ar complica foarte mult compilatorul și ar necesita ca versiunea compilatorului să fie schimbată de fiecare dată când sunt adăugate, eliminate sau modificate caracteristici Pentru programatorii de aplicații, totuși, această abordare ar fi foarte convenabilă, deoarece funcțiile standard ar fi întotdeauna disponibile O altă abordare ar fi să puneți toate funcțiile standard ale limbajului C într-un singur modul obiect relocabil, să spunem libc o, pe care programatorii de aplicații ar putea să-l conecteze la modulele lor executabile: unix> gcc main c /usr/lib/libc o Partea a II-a Executarea programelor în sistem Această abordare are avantajul că ar separa implementarea funcțiilor standard de implementarea compilatorului și ar fi totuși destul de convenabilă pentru programatori Cu toate acestea, marele său dezavantaj este că fiecare fișier executabil de pe sistem ar conține acum o copie completă a setului de funcții standard, ceea ce ar fi extrem de risipitor în ceea ce privește utilizarea spațiului pe disc Pe un sistem tipic, libc a este de aproximativ MB și libm a este de aproximativ MB Mai rău, fiecare program de execuție ar avea acum propria copie a acestor funcții în memorie, ceea ce ar fi extrem de risipitor în ceea ce privește utilizarea memoriei Un alt mare inconvenient este că orice modificare a oricărei funcții standard, oricât de minoră ar fi, ar necesita dezvoltatorul bibliotecii să recompileze întregul fișier sursă, o operațiune consumatoare de timp care ar complica dezvoltarea și întreținerea funcțiilor standard Am putea atenua unele dintre aceste probleme prin crearea unui fișier relocabil separat pentru fiecare funcție standard și stocarea acestor fișiere într-un director cunoscut Cu toate acestea, această abordare ar cere programatorilor de aplicații să editeze în mod explicit legăturile modulelor obiect corespunzătoare în executabile, un proces care este predispus la erori și consuma mult timp: unix> gcc main c /usr/lib/printf o /usr/lib/scanf o Conceptul de bibliotecă statică a fost dezvoltat pentru a aborda dezavantajele acestor diverse abordări Funcțiile înrudite pot fi compilate în module obiecte separate și apoi compilate într-un singur fișier de bibliotecă static Programele de aplicație pot folosi oricare dintre aceste funcții definite în bibliotecă, specificând doar numele fișierului pe linia de comandă De exemplu, un program care utilizează funcțiile bibliotecii standard C și ale bibliotecii de matematică poate fi compilat și legat cu următoarea comandă: unix> gcc main c /usr/lib/libm a /usr/lib/libc a La momentul legăturii, linkerul copiează doar modulele obiect care sunt referite din program, ceea ce reduce dimensiunea executabilului pe disc și în memorie Pe de altă parte, programatorul de aplicații trebuie să includă doar numele câtorva fișiere de bibliotecă De fapt, dispeceratorii compilatorului C transmit întotdeauna libc a către linker, astfel încât linkul către libc a menționat mai devreme nu este necesar Pe sistemele Unix, bibliotecile statice sunt stocate pe disc într-un format special cunoscut sub numele de fișiere de arhivă O arhivă este o colecție de fișiere obiect relocabile asociate cu un antet care descrie dimensiunea și adresa fiecărui element din fișierul obiect Numele fișierelor de arhivă sunt notate cu extensia a Pentru a fi specific despre biblioteci, să presupunem că ne concentrăm pe rutinele de manipulare vectorială prezentate în Listarea din biblioteca statică libvector a Capitolul Editarea legăturilor void addvec(int *x, int *y, void multvec(int *x, int *y, int *z, int n) int *z, int n) { { int i; int i; pentru (i = ; i gcc -c addvec c multvec c unix> ar rcs libvector a addvec o multvec o Pentru a utiliza această bibliotecă, puteți scrie o aplicație precum type c în listarea - , care apelează procedura de bibliotecă addvec (fișierul antet vector h definește prototipurile de funcție pentru procedurile din libvector a) /* mine c */ #include #include „vector h” int x[ ] = { , }; int y[ ] = { , ) ; intz[ ]; opt int main() { addvec(x, y, z, ); printf("z = [%d %d]\n", z[ ], z[l]); returnează ; paisprezece } Pentru a construi executabilul, compilăm și legăm fișierele de intrare main o și libvector a: unix> gcc - -c main c unix> gcc -static -o p main o /libvector a Pe fig arată rezultatul activităților editorului de linkuri Opțiunea -static îi spune managerului compilatorului că linker-ul ar trebui să construiască un fișier obiect executabil complet legat, care poate fi încărcat în memorie și rulat pentru execuție fără a necesita nicio prelucrare ulterioară a legăturii Partea a II-a Executarea programelor în sistem zey în timpul încărcării Când linker-ul este rulat, detectează că numele addvec definit în addvec o este referit din main o, așa că copie addvec o în executabil Deoarece acest program nu se leagă la numele definite în muitvec o, linkerul nu copiază acest modul în executabil Linkerul copiază, de asemenea, modulul printf o din libc a, împreună cu alte câteva module Fișiere sursă main c vector h Traducători (cpp, ccl, as) libvector a i ix a Biblioteci statice Fișiere obiect relocabile printf o și alte module numite de printf o p Fișierele obiect executabile legate Orez Editarea legăturilor către biblioteci statice Utilizarea bibliotecilor statice Deși bibliotecile statice sunt instrumente utile și necesare, ele sunt, de asemenea, o sursă de incertitudine pentru programatori din cauza lipsei de cunoaștere a metodelor utilizate de linkerul Unix la rezolvarea referințelor externe În timpul fazei de rezoluție a legăturilor, linkerul scanează fișierele obiect relocabile și arhiva de la stânga la dreapta, în aceeași ordine în care apar pe linia de comandă a managerului compilatorului În timpul scanării curente, linker-ul menține un set E de fișiere obiect relocabile care vor fi combinate pentru a forma un executabil, un set U de nume nerezolvate (care sunt referite, dar nedefinite încă) și un set D de nume care au fost definite în fișierele de intrare anterioare Inițial E, U și D sunt goale Pentru fiecare fișier de intrare f de pe linia de comandă, linkerul determină dacă f este un fișier obiect sau un fișier arhivă Dacă se dovedește că f este un fișier obiect, atunci linkerul adaugă f la E, ajustează U și D pentru a reflecta numele și definițiile link-ului în/ și trece la următorul fișier de intrare Dacă se dovedește că f este o arhivă, atunci linkerul încearcă să se potrivească nume definite ca elemente de arhivă care se potrivesc cu nume nerezolvate în U Dacă un element de arhivă, cum ar fi /u, specifică un nume care rezolvă o legătură în U, atunci m va fi atașat la £, iar linkerul va ajusta U și D pentru a reflecta definițiile numelui și linkului în t Acest proces secvenţial Secțiunea Editarea legăturilor se repetă peste elementele fișierului obiect de arhivă până când se ajunge la un punct în care U și D nu se mai schimbă Din acest moment, toate elementele fișierului obiect care nu sunt conținute în E sunt pur și simplu aruncate, iar linkerul trece la următorul fișier de intrare Dacă, după ce linker-ul termină de a căuta fișierele de intrare pe linia de comandă, dacă U nu este gol, acesta afișează un mesaj de eroare și iese În caz contrar, concatenează și mută fișierele obiect în E pentru a construi executabilul de ieșire Din păcate, acest algoritm poate duce la unele erori confuze în timpul editării, deoarece ordinea bibliotecilor și a fișierelor obiect pe linia de comandă este semnificativă Dacă o bibliotecă care definește un nume apare pe linia de comandă înaintea unui fișier obiect care se referă la acel nume, legătura nu va fi rezolvată și legătura va eșua De exemplu, luați în considerare următoarele linii: unix> gcc -static /libvector a main c /tmp/cc XH Rp o: În funcția „main”: (în funcția „main”) /tmp/cc XH Rp o( text+ xl ): referință nedefinită la „addvec” Ce s-a intamplat aici? În timpul procesării libvector a, setul U va fi gol, astfel încât niciun element de fișier obiect din libvector a nu va fi adăugat la £ Astfel, legătura către addvec nu va fi niciodată rezolvată, editorul de link-uri dă un mesaj de eroare și iese Regula generală pentru biblioteci este să le plasați la sfârșitul liniei de comandă Dacă elementele diferitelor biblioteci sunt independente, în sensul că niciun element nu se referă la un nume definit într-un alt element, atunci bibliotecile pot fi plasate la sfârșitul liniei de comandă în orice ordine Dacă, pe de altă parte, bibliotecile nu sunt independente, atunci ele trebuie ordonate astfel încât pentru fiecare nume s care este referit extern dintr-un element de arhivă, cel puțin o definiție a lui urmează referința la pe linia de comandă De exemplu, să presupunem că foo c apelează funcții de la libx a și de la libz a, care ambele apelează funcții de la liby a Apoi libx a și libz a trebuie să precedă liby a pe linia de comandă: unix> gcc foo c libx a libz a liby a Bibliotecile pot fi repetate pe linia de comandă dacă este necesar pentru a satisface cerințele de dependență De exemplu, să presupunem că foo c apelează o funcție din libx a, acea funcție apelează o funcție din liby a care apelează o funcție din libx a Apoi funcția libx a trebuie repetată pe linia de comandă: unix> gcc foo c libx a liby a libx a O alternativă ar fi să combinați libx a și liby a într-o singură arhivă Partea a II-a Executarea programelor în sistem EXERCIȚIUL Fie a și b să desemneze module obiecte sau biblioteci statice din directorul curent, iar a -> b să desemneze că a depinde de b, în sensul că b specifică numele referit de la a Pentru fiecare dintre următoarele scenarii, furnizați linia de comandă minimă (cu cele mai puține fișiere obiect și argumente de bibliotecă) care va permite linkerului static să rezolve toate referințele de nume p o -> libx a p o -> libx a -> liby a po -> libx a -> liby a și liby a -> libx a -> po in miscare Odată ce linkerul a finalizat pasul de rezoluție a legăturii, fiecare referință de nume din cod va fi asociată cu exact o definiție de nume (o intrare în tabelul de nume într-unul dintre modulele sale de intrare) În acest moment, linkerul cunoaște dimensiunile exacte ale secțiunilor de cod și date din modulele sale obiect de intrare Acum este gata să înceapă faza de mutare, în timpul căreia combină modulele de intrare și atribuie adrese de rulare fiecărui nume Mișcarea se face în doi pași Mutarea secțiunilor și a definițiilor de nume În acest pas, linker-ul combină toate secțiunile de același tip într-o nouă secțiune compusă de același tip De exemplu, toate secțiunile data din modulele de intrare sunt îmbinate într-o singură secțiune care va deveni secțiunea data pentru fișierul obiect executabil de ieșire Linkerul atribuie apoi adrese de memorie de rulare noilor secțiuni compuse, pentru fiecare secțiune definită de modulele de intrare și pentru fiecare nume definit de modulele de intrare După finalizarea acestui pas, fiecare instrucțiune (mașină) și fiecare variabilă globală din program vor avea o adresă unică de memorie de rulare Mutarea referințelor la nume în cadrul secțiunilor În acest pas, linker-ul modifică fiecare referință de nume din corpul codului și secțiunea de date pentru a indica adresa corectă de rulare Pentru a face acest pas, linkerul se bazează pe structurile de date din modulele obiect relocabile, așa-numitele intrări de relocare, pe care le vom analiza mai târziu Intrări de mișcare Când asamblatorul generează un modul obiect, nu știe unde vor fi stocate acest cod și datele în memorie Nici nu cunoaște adrese ale funcțiilor definite extern sau ale variabilelor globale la care se face referire din acest modul Prin urmare, ori de câte ori asamblatorul întâlnește o referință de obiect a cărei locație finală este necunoscută, generează o intrare de mutare Capitolul Editarea legăturilor un linker care îi spune linkerului cum să schimbe legătura atunci când concatenează fișiere obiect într-un fișier executabil Intrările de relocare pentru cod sunt localizate în relo text Intrările de relocare pentru datele inițializate sunt localizate în relo data Lista arată formatul intrării de mutare ELF Variabila offset este offset-ul din secțiunea pentru legătura care urmează să fie modificată Simbolul variabilei identifică numele către care ar trebui să indice referința modificată Variabila de tip îi spune editorului de legături cum să modifice noul link ^Listing : ;VxdD;mutare^LF swap(); : R PC schimb de intrare mutare Din această listă, puteți vedea că instrucțiunea de apel caii începe la secțiunea offset x și constă dintr-un cod operațional de un singur octet x urmat de o referință de de biți Oxffffffffc (zecimal - ) stocată în memoria little endian Există, de asemenea, o intrare de mutare pentru acest link, afișată pe rândul următor (Reamintim că intrările de mutare și comandă sunt de fapt stocate în diferite secțiuni ale fișierului obiect Utilitarul objdump le arată împreună pentru comoditate ) Intrarea de mutare r constă din trei câmpuri: g offset = x r simbol = swap r tip = R PC Aceste zone îi spun linkerului că referința relativă la PC pe de biți situată la offset x ar trebui modificată în timpul rulării, astfel încât Capitolul Editarea legăturilor a indicat subrutina de schimb Acum să presupunem că linkerul a determinat asta ADDR(e) = ADDR( text) = x b Și ADDR(r simbol) = ADDR(swap) = Ox c Folosind algoritmul din Listarea , editorul de linkuri calculează mai întâi adresa timpului de execuție a linkului (linia din Listare): refaddr = addr(s) + r offset = x b + x = x bb Apoi actualizează referința prin schimbarea valorii sale curente (- ) la x , astfel încât să indice subrutina de schimb în timpul execuției (linia din lista - ): *refptr = (nesemnat) (ADDR(g simbol) + *refptr - refaddr) = (nesemnat) ( x c + (- ) - x bb) = (nesemnat) ( x ) În fișierul obiect executabil rezultat, comanda caii are următoarea formă relocabilă: ba: e caii c swap(); În timpul execuției, comanda de apel va fi stocată la adresa x ba Când CPU execută o instrucțiune de apel, computerul conține valoarea x bf, care este adresa instrucțiunii imediat următoare instrucțiunii de apel Pentru a executa această comandă, CPU face următorii pași: Împingeți computerul pe stivă PC : : : R buf int *bufpo = &buf[ ]; mutați intrarea Vedem că secțiunea data conține o singură referință de de biți, indicatorul bufpO, care are valoarea x Intrarea de mutare îi spune linkerului că este o referință absolută de de biți situată la offset , care ar trebui mutată pentru a indica numele buf Acum să presupunem că linkerul a determinat asta ADDR(r simbol) = ADDR(buf) = x Editorul de linkuri corectează linia de utilizare a linkului din algoritmul din lista : *refptr = (nesemnat) (ADDRfr symbol) + *refptr) = (nesemnat) ( x + ) = (nesemnat) ( x ) În fișierul obiect executabil rezultat, legătura are următoarea formă relocabilă: c : s: mutat! Cu alte cuvinte, linker-ul a decis ca la runtime variabila bufpO va fi localizată în memorie la adresa x c și va fi inițializată la valoarea x , care este adresa de rulare a matricei buf Secțiunea text din modulul swap o conține cinci referințe absolute care sunt mutate într-un mod similar (vezi exercițiul ) Listările - și - arată secțiunile text și data relocate în fișierul obiect executabil rezultat : b : push %ebp b : e mov %esp,%ebp ba: ec sub $ x ,%esp bf: e caii c swap() s : : s org %eax,%eax s : es mov %ebp,%esp c : d pop %ebp с : : сЗ ret Capitolul Editarea legăturilor c : pori c : pori b : pori c : c : push %ebp c : b c mov x c,%edx Obțineți *bufp cf: al mov x ,%eax Get buf[ ] d : : e mov %esp,%ebp d : : c movl $ x x dd: e : : ec mov %ebp,%esp e : : b a mov(%edx),%ecx e : : mutare %eax,(%edx) e : al mov x ,%eax Get *bufpl eb: mov %ecx,(%eax) ed: d Pop %ebp ee: : c ret IrPisting bgPerbSecțiunea de date maximă : : c : с Mutat! EXERCIȚIUL Acest exercițiu este legat de programul relocabil din Listatul - Care este adresa hexadecimală a legăturii swap mutate de pe linia ? Care este valoarea hexadecimală a referinței de schimb mutat pe linia ? Să presupunem că linkerul decide dintr-un anumit motiv să specifice adresa secțiunii text ca x b în loc de x b Care ar fi valoarea hex a referinței mutate de pe linia în acest caz? Fișiere obiecte executabile Am văzut deja cum linkerul combină mai multe module obiect într-un singur fișier obiect executabil Programul nostru C, care a început ca o simplă colecție de fișiere text ASCII, a fost convertit într-un singur fișier binar care conține toate informațiile necesare pentru a încărca programul în memorie și a-l rula pentru execuție Orez rezumă toate tipurile de date într-un fișier executabil tipic ELF Partea a II-a Executarea programelor în sistem Descrie o secțiune a unui fișier obiect o Secțiunea de performanță continuă a fișierelor/Segmente de memorie Antet ELF Segment antet tabel init > text rodata date bss► symtab depanare linie > strtab Antetul tabelului Secțiunea Memorie numai pentru citire (segment de cod) Memorie pentru citire și scriere (segment de date) Tabel cu simboluri Informațiile de depanare nu au fost încărcate în memorie Orez Un fișier obiect ELF executabil tipic Formatul unui fișier obiect executabil este similar cu cel al unui fișier obiect relocabil Antetul ELF descrie formatul complet al fișierului Conține, de asemenea, punctul de intrare al programului, care este adresa primei instrucțiuni executabile atunci când programul este invocat Secțiunile text, rodata și data sunt similare cu cele ale unui fișier obiect relocabil, cu excepția faptului că aceste secțiuni au fost deja relocate în pozițiile finale ale adresei de memorie din timpul rulării Secțiunea init definește o funcție mică numită init care este apelată de codul de inițializare al programului Deoarece executabilul este complet conectat (inclusiv relocari), nu are nevoie de un geo Executabilele ELF sunt proiectate pentru a fi pur și simplu încărcate în memorie prin maparea porțiunilor adiacente ale executabilului la segmente de memorie adiacente Această mapare este descrisă folosind un tabel de antet de segment Lista - definește tabelul antet de segment pentru exemplul nostru executabil p, așa cum este reprezentat de utilitarul objdump I Lista Anteturi de segment Segment de cod numai pentru citire LOAD off x vaddr x paddr x align ** fișierez x memsz x steaguri rx Segment de date de citire/scriere LOAD off x vaddr x paddr x align ** fișierez x e memsz x steaguri rw- Lista - utilizează următoarele convenții: off este decalajul fișierului, vaddr/paddr este adresa virtuală/fizică, align este alinierea segmentului, Capitolul Editarea legăturilor fiiesz este dimensiunea segmentului din fișierul obiect, memsz este dimensiunea segmentului din memorie, steagurile sunt permisiunile de rulare Din acest tabel de antet de segment, vedem că două segmente de memorie vor fi inițializate cu conținutul fișierului obiect executabil Liniile și ne spun că primul segment (segment de cod de program) este aliniat la KB, are acces de citire și execuție, începe în memorie la x , are o dimensiune totală a memoriei de x octeți și va fi inițializat cu primii x octeți de fișierul obiect executabil, care include antetul ELF, tabelul antet segment și secțiunile init, text și rodata Liniile și ne spun că al doilea segment (segmentul de date) va fi aliniat pe o graniță de K și va avea acces de citire și scriere Începe de la x în memorie, ocupă x octeți în memorie și va fi inițializat cu x octeți începând cu offset-ul fișierului x , care în acest caz corespunde începutului secțiunii data Restul octeților din acest segment corespund datelor de tip bss, care vor fi inițializați la zero în timpul rulării Încărcarea fișierelor obiecte executabile Pentru a rula fișierul obiect executabil p, putem introduce numele acestuia pe tastatură la linia de comandă a shell-ului Unix: unix> /p Deoarece p nu corespunde nici unei comenzi shell încorporate, shell-ul presupune că p este un fișier obiect executabil pe care îl execută apelând un cod de sistem de operare rezident în memorie numit bootloader Fiecare program Unix poate porni bootloader-ul apelând funcția exec e, pe care o vom descrie în detaliu în Sect Încărcătorul copiază codul programului și datele de pe disc pe un fișier obiect executabil din memorie și apoi rulează programul, trecând controlul primei sale comenzi sau punct de intrare Acest proces de copiere a unui program în memorie și apoi executare este cunoscut sub numele de încărcare Fiecare program Unix are un model de utilizare a memoriei în timpul rulării similar cu cel prezentat în Figura Pe sistemele Linux, segmentul de cod al programului începe întotdeauna la x Segmentul de date urmează adresa aliniată la K după codul programului Heap-ul urmează prima adresă aliniată la K după segmentul de citire/scriere și crește pe măsură ce intră apelurile către funcția de bibliotecă malloc (malloc și heap sunt descrise în detaliu în Secțiunea ) Segmentul care începe la adresa x este rezervat bibliotecilor partajate Stiva de utilizatori începe întotdeauna la adresa Oxbffffffff și scade (pentru a scădea adresele de memorie) Segment care începe deasupra stivei la adresa Partea a II-a Executarea programelor în sistem ohsooooooooo, este rezervat pentru codul programului și datele părții rezidente a sistemului de operare, cunoscut sub numele de kernel Ohsoooooooo Stiva de utilizatori (în timpul rulării) -— — —, Invizibil pentru codul utilizatorului ■%ear (indicator de stivă) x Zona de memorie pentru biblioteci partajate Memoria dinamică (creată de mai os) brk x Citiți și scrieți segmentul ( date, bss) Segment de numai citire ( init, text, rodata) Încărcat din executabil Nefolosit despre Orez Schema de utilizare a memoriei de rulare în Linux După ce bootloader-ul începe să funcționeze, creează o imagine de memorie conform schemei prezentate în Fig Pe baza tabelului de anteturi de segment din fișierul executabil, acesta copiază porțiuni din fișierul executabil în codul programului și segmentele de date Încărcătorul transferă apoi controlul către punctul de intrare în program, care este întotdeauna o adresă numită start Codul de pornire care începe de la pornire este definit în fișierul obiect crtl o și este același pentru toate programele C Listarea - arată o secvență tipică de apeluri din codul de pornire După apelarea procedurii de inițializare din secțiunile text și init, codul de pornire apelează procedura atexit, care se adaugă la lista de proceduri apelate atunci când aplicația apelează funcția de ieșire Funcția de ieșire rulează funcțiile înregistrate ca atexit și apoi returnează controlul sistemului de operare prin apelarea exit Apoi, codul de pornire apelează procedura principală a aplicației, care începe să execute codul nostru C Când aplicația ajunge la instrucțiunea return, codul de pornire apelează procedura de ieșire, care returnează controlul sistemului de operare I Lista Pseudo-cod al procedurii de pornire : J j x c : /* punct de intrare text */ caii libc init first /* cod de pornire în text */ Capitolul Editarea legăturilor caii init /* cod de pornire în init */ caii atexit /* cod de pornire în text */ caii main /* procedura principala in aplicatie */ b caii exit /* returnează controlul către sistemul de operare */ /* controlul nu ajunge niciodată în acest punct */ Cum funcționează cu adevărat încărcătoarele? Descrierea noastră de boot este corectă din punct de vedere conceptual, dar am făcut-o în mod deliberat incompletă Pentru a înțelege cum se întâmplă de fapt încărcarea, trebuie să înțelegeți conceptele de procese, memorie virtuală și alocare de memorie, despre care nu am discutat încă Mai târziu, când vom cunoaște aceste concepte în capitolele și , vom reveni din nou la problema încărcării și vom dezvălui treptat acest secret Pentru cititorul nerăbdător, iată o previzualizare a modului în care funcționează bootloader-ul real Fiecare program dintr-un sistem Unix rulează în contextul unui proces în propriul său spațiu de adrese virtuale Când shell-ul rulează un program, procesul părinte se bifurcă, generând un proces copil care este un duplicat al părintelui Procesul copil generat invocă bootloader-ul prin apelul de sistem exec Încărcătorul elimină segmentele de memorie virtuală existente ale copilului și creează un nou set de segmente de cod, date, heap și stivă Noile segmente de stivă și heap sunt inițializate la zero Noile segmente de cod de program și de date sunt inițializate cu valoarea conținutului fișierului executabil prin maparea paginilor din spațiul de adrese virtuale în secțiuni de dimensiunea unei pagini ale fișierului executabil În cele din urmă, încărcătorul transferă controlul către start, care în cele din urmă apelează rutina principală a aplicației În afară de unele informații din antet, nu sunt copiate date de pe disc în memorie în timpul pornirii Copia va fi amânată până când CPU face referire la pagina virtuală mapată, moment în care sistemul de operare va transfera automat pagina de pe disc în memorie folosind mecanismul său de paginare EXERCIȚIUL De ce fiecare program C necesită o procedură numită principal? Te-ai întrebat vreodată de ce în limbajul C procedura principală se poate încheia cu un apel de ieșire, o instrucțiune de returnare și, în absența ambelor, își finalizează încă funcționarea corect? Explica Conectare dinamică cu biblioteci partajate Bibliotecile statice, pe care le-am studiat în Sect a ridicat o mulțime de întrebări legate de prezența unui set mare de funcții disponibile pentru programele de aplicație Cu toate acestea, bibliotecile statice au încă unele Partea a II-a Executarea programelor în sistem inconvenient de mers pe jos Bibliotecile statice, la fel ca toate celelalte programe software, trebuie întreținute și modificate periodic Dacă un programator de aplicații dorește să folosească cea mai recentă versiune a unei biblioteci, trebuie să fie cumva conștient de ce biblioteci sunt modificate și apoi să-și reconecteze în mod explicit programele folosind bibliotecile modificate O altă problemă este că aproape fiecare program C utilizează funcții standard I/O, cum ar fi printf și scanf În timpul execuției, codul pentru aceste funcții va fi duplicat în segmentul de text al fiecărui proces care rulează O situație tipică este atunci când sistemul va rula - de procese, iar acest lucru poate reprezenta o risipă semnificativă a resurselor limitate de memorie de sistem O proprietate interesantă a memoriei este că va fi întotdeauna o resursă limitată, indiferent cât de mult este disponibil în sistem Această proprietate este comună pentru spațiul de depozitare și coșurile de bucătărie Biblioteci partajate (bibliotecă partajată) - una dintre cele mai recente inovații, care a fost creată pentru a elimina deficiențele bibliotecilor statice O bibliotecă partajată este un modul obiect care poate fi încărcat în timpul rulării la o adresă de memorie arbitrară și legat la un program din memorie Acest proces este cunoscut sub numele de conectare dinamică și este realizat de un program numit linker dinamic Bibliotecile partajate sunt, de asemenea, obiecte partajate, iar pe sistemele Unix au de obicei extensia de fișier so Microsoft folosește intens bibliotecile partajate, pe care le numesc DLL (Dynamic Link Libraries, biblioteci legate dinamic) Bibliotecile partajate pot fi partajate în două moduri diferite În primul rând, există exact un fișier so pentru o anumită bibliotecă pe orice sistem de fișiere dat Codul și datele din acest fișier sunt partajate între toate fișierele obiect executabile care fac referire la biblioteca dată, spre deosebire de conținutul bibliotecilor statice, care sunt copiate și încorporate în fișierele executabile care fac referire la ele În al doilea rând, o singură copie în memorie a secțiunii text a unei biblioteci partajate poate fi partajată între diferite procese care rulează Ne vom uita la asta mai detaliat după ce vom analiza memoria virtuală în Capitolul Pe fig Figura - rezumă studiul nostru asupra procesului de legare dinamică folosind Lista - ca exemplu Pentru a construi biblioteca partajată libvector so a rutinelor noastre de aritmetică vectorială de exemplu (Listarea - ), trebuie să invocăm managerul compilatorului cu următoarea directivă specială către linker: unix> gcc -shared -fPIC -o libvector so addvec c multvec c Indicatorul -fPic indică compilatorului să genereze cod independent de poziție Indicatorul -shared îi spune linkerului să creeze un fișier obiect partajat Capitolul : Editarea legăturilor Traducători (срр,сі,as) libc so libvector so Fișierul obiect main o relocabil i Linker (ia) Fișier obiect p executabil ▼ parțial legat Informații din tabelul de simboluri libc so libvector so Încărcător (executiv) Coduri și date Complet amenajat G Z „TJ G | în memorie I Dynamichnker(id-iinux so) | Orez Proces de conectare dinamică Odată ce am creat biblioteca, o putem conecta cu programul nostru exemplu din Lista - : unix> gcc -o p main c /libvector so Acest lucru creează un fișier obiect p executabil într-o formă care vă permite să editați legături către libvector so în timpul execuției Ideea de bază este să faceți o parte din editarea legăturii în mod static după ce executabilul este construit și apoi să finalizați procesul de conectare în mod dinamic după ce programul este încărcat Este important să înțelegeți că în acest moment nici codul, nici secțiunile de date din libvector so nu sunt de fapt copiate în executabilul p În schimb, linkerul copiează unele informații din tabelul de relocare și din tabelul de nume, ceea ce va permite ca referințele la cod și datele din libvector so să fie rezolvate în timpul rulării Când încărcătorul încarcă și apoi rulează executabilul p , acesta încarcă executabilul p parțial legat folosind metodele discutate în Secțiunea Apoi avertizează că p conține o secțiune interp, care conține calea fișierului de linker dinamic, care este obiectul partajat în sine În loc să treacă controlul către aplicație, așa cum ar face în mod normal, încărcătorul încarcă și rulează linkerul dinamic Linkerul dinamic finalizează apoi sarcina de aspect făcând următoarele: Partea a II-a Executarea programelor în sistem □ mutarea textului și a datelor din libc so într-un anumit segment de memorie Pe sistemele IA bazate pe Linux, bibliotecile partajate sunt încărcate într-o regiune începând cu x (vezi Figura ); □ mutarea textului și datelor libvector so într-un alt segment de memorie; □ mutarea fiecărei legături din p la numele definite în libc so și libvector so În cele din urmă, linkerul dinamic transmite controlul către aplicație De acum înainte, locațiile bibliotecilor partajate sunt setate și nu se modifică în timpul execuției programului Se încarcă și se leagă cu biblioteci partajate din aplicații Până în acest punct, ne-am uitat la scenariul în care încărcătorul dinamic încarcă și leagă biblioteci partajate pe măsură ce aplicația pornește, chiar înainte ca aplicația să fie executată Cu toate acestea, este, de asemenea, posibil ca o aplicație să solicite încărcătorului dinamic să încarce și să editeze legături către biblioteci partajate arbitrare în timpul executării acelei aplicații, fără a fi nevoie să editeze legăturile din acea aplicație către acele biblioteci în timpul compilării Legarea dinamică este o caracteristică puternică și utilă Iată doar câteva exemple din practică: □ Distribuție software Dezvoltatorii de aplicații Microsoft Windows folosesc adesea biblioteci partajate pentru a distribui upgrade-uri de software Acestea generează o nouă copie a bibliotecii partajate, după care utilizatorii o pot descărca și utiliza ca înlocuitor pentru versiunea curentă Când își lansează ulterior aplicațiile, acele aplicații vor fi conectate și încărcate automat cu noua bibliotecă partajată □ Construirea de servere Web de înaltă performanță Multe servere Web au conținut dinamic, cum ar fi pagini web personalizate, solduri de cont curent și reclame Primele servere Web au creat conținut dinamic folosind funcțiile fork și exec folosind un proces copil Dar serverele Web de înaltă performanță din ziua de azi folosesc o abordare mult mai eficientă și mai sofisticată, bazată pe legături dinamice Ideea este de a împacheta fiecare funcție care generează conținut dinamic într-o bibliotecă partajată Când o solicitare ajunge la browserul web, serverul încarcă dinamic funcția corespunzătoare și editează linkurile, apoi o apelează direct în loc să folosească fork și exce pentru a rula acea funcție în contextul procesului copil generat Funcția rămâne în spațiul de adrese al serverului (plasat în cache), deci solicitările ulterioare Capitolul Editarea legăturilor poate fi procesat prin simpla apelare a acestei funcții Acest lucru poate avea un impact semnificativ asupra performanței site-ului În plus, funcțiile existente pot fi modificate și pot fi adăugate funcții noi în timpul rulării fără a închide serverul Sistemele de clasă Unix, cum ar fi Linux și Solaris, oferă o interfață simplă de încărcare dinamică care permite programelor de aplicație să încarce și să conecteze biblioteci partajate în timpul rulării tfinclude void *dlopen(const char *filename, int flag); Funcția returnează un pointer la mâner dacă totul este în ordine și NULL în cazul unei erori Funcția dlopen încarcă și editează link-uri către numele fișierului bibliotecii partajate Numele externe din fiiename sunt rezolvate folosind biblioteci deschise anterior cu steag-ul rtld global Dacă executabilul curent a fost compilat cu indicatorul -rdynamic, atunci numele sale globale sunt disponibile și pentru rezolvarea numelor Argumentul flag trebuie să fie fie rtld now, care îi spune linkerului să rezolve direct referințele la nume externe, fie rtld lazy, care îi spune linkerului să amâne rezoluția legăturilor până când codul din bibliotecă este executat Ambele valori pot fi asociate OR împreună cu steag-ul rtld global #include void *dlsym(void *mâner, char *simbol); Funcția disym preia un handle către o bibliotecă partajată deschisă anterior și un simbol de identificare ca argumente și returnează adresa corespunzătoare acelui identificator dacă acea adresă există, sau NULL în caz contrar #include int dlclose(void *handle); Funcția returnează dacă totul este ok și - dacă există o eroare Funcția dlclose descarcă o bibliotecă partajată dacă nicio altă bibliotecă partajată nu o folosește deja #include const char *dlerror(void); Funcția dierror returnează un șir care descrie cea mai recentă eroare care a apărut ca urmare a unui apel la dlopen, disym sau dlclose, sau NULL dacă nu a existat nicio eroare Lista - arată cum această interfață poate fi utilizată pentru a conecta dinamic biblioteca noastră partajată libvector so (lis Partea a II-a Executarea programelor în sistem ting ) și apoi apelați procedura addvec Pentru a compila programul, trebuie să apelăm GCC astfel: ^ Listarea L E Editarea linkurilor bibliotecii > C “ unix> gcc -rdynamic - -o r min c -Idl #include #include int x[ ] = { , }; int y[ ] = { , ); intz[ ]; int main() nouă { void *mâner; void (*addvec)(int ★, int *, int ♦, int); caractere *eroare; /* încarcă dinamic o bibliotecă partajată care conține addvec() */ handle = dlopen(" /libvector so”, RTLD LAZY); dacă (!mâner) { fprintf(stderr, „%s\n”, dlerrorO); ieșire(l); nouăsprezece } douăzeci /* Obține un pointer către funcția addvec() pe care tocmai o facem încărcat */ ddvec = dlsym(handle, "addvec"); dacă ((eroare = dlerrorO) != NULL) { fprintf(stderr, „%s\n”, eroare); iesire(l); } /* Acum putem apela addvec() la fel ca oricare altul functie */ addvec(x, y, z, ); printf("z = [%d %d]\n", z[ ], z[l]); /* descărcați biblioteca partajată */ if (dlclose(handle) : ff jmp * x # sări la *GOT[ ] a: pushl $ x # ID pentru pnntf f: e eO ff ff ff jmp # sări la PLT[ ] PLT[ ] : ff jmp * x # sări la *GOT[ ] a: pushl $ x # ID pentru addvec f: e dO ff ff ff jmp # sări la PLT[ ] Inițial, după ce programul este legat și executat dinamic, procedurile printf și addvec sunt asociate cu prima comandă a intrării lor PLT corespunzătoare De exemplu, apelul la addvec este de forma bb: e a fe ff ff caii Când addvec este apelat pentru prima dată, controlul este transferat la prima comandă din PLT[ ], care sare indirect prin GOT[ ] Inițial, fiecare intrare GOT conține adresa intrării pushl în intrarea PLT corespunzătoare Prin urmare, un salt indirect la PLT pur și simplu readuce controlul la următoarea instrucțiune din PLT[ ] Această comandă împinge în stivă ID-ul pentru numele addvec Ultimele instrucțiuni provoacă un salt la PLT[ ], unde un alt cuvânt de informare de identificare de la GOT[ ] este împins în stivă, iar apoi controlul este transferat indirect prin GOT[ ] către linkerul dinamic Linkerul dinamic folosește două intrări de stivă pentru a determina adresa addvec, scrie la GOT[ ] acea adresă și transferă controlul către addvec Data viitoare când addvec este apelat în acest program, controlul este transferat la PLT [ ] ca înainte Dar de data aceasta, saltul indirect prin GOT[ ] transferă controlul către addvec De acum înainte, singura suprasarcină suplimentară este referirea la adresa de memorie pentru saltul indirect Capitolul , Editarea legăturilor Instrumente de gestionare a fișierelor obiect Există mai multe utilitare disponibile pe sistemul Unix care vă vor ajuta să înțelegeți și să gestionați conceptele fișierelor obiect În special, pachetul GNU binutils, care rulează pe orice platformă Unix, este deosebit de util □ AR - Creează biblioteci statice, inserează, șterge, listează elemente și extrage elementele acestora □ STR NGS - listează toate liniile imprimabile conținute în fișierul obiect □ STRIP - elimină tabelul de nume din fișierul obiect □ NM - listează numele definite în tabelul de nume al fișierului obiect □ SIZE - Listează numele și listează dimensiunile secțiunilor din fișierul obiect □ READELF - Afișează structura completă a fișierului obiect, inclusiv toate informațiile codificate în antetul ELF □ OBJDUMP este baza tuturor utilitarelor binare Poate afișa toate informațiile dintr-un fișier obiect Funcția sa cea mai utilizată este dezasamblarea codurilor binare în secțiunea text Sistemele Unix oferă, de asemenea, programul idd pentru gestionarea bibliotecilor partajate □ LDD - Listează bibliotecile partajate de care executabilul are nevoie în timpul rulării rezumat Editarea legăturilor se poate face în timpul compilării cu un linker static, în timpul încărcării și în timpul execuției cu un încărcător dinamic Editorii de legături lucrează cu fișiere binare numite fișiere obiect, care vin în trei forme: relocabile, executabile și partajate Fișierele obiect relocabile sunt asamblate folosind linkere statice într-un fișier obiect executabil care poate fi încărcat în memorie și executat Fișierele obiect partajate (biblioteci partajate) sunt legate și încărcate folosind încărcătoare dinamice în timpul rulării, fie implicit dacă programul apelant este încărcat și începe să se execute, fie la cerere când o funcție este apelată de un program din biblioteca diopen Editorii de legături îndeplinesc două sarcini principale - rezoluția legăturilor, care va lega fiecare nume global din fișierul obiect la o definiție unică și relocarea, care va determina adresa de memorie finală pentru fiecare nume și va modifica referințele la aceste obiecte Partea a II-a Executarea programelor în sistem Legăturile statice sunt invocate folosind un manager de compilator, cum ar fi gcc Ele leagă mai multe fișiere obiect relocabile diferite într-un singur fișier obiect executabil Diferite fișiere obiect pot defini același nume, iar regulile pe care le folosesc pentru a rezolva aceste definiții implicite diferite pot duce la erori insidioase în programele utilizatorului Mai multe fișiere obiect pot fi combinate într-o singură bibliotecă statică Bibliotecile sunt folosite de linkerii pentru a rezolva referințele de nume din alte module obiect Scanarea secvenţială de la stânga la dreapta pe care o folosesc mulţi editori de linkuri pentru a rezolva referinţele de nume este o altă sursă de erori greu de explicat în timpul editării linkurilor Încărcătoarele mapează conținutul fișierelor executabile în memorie și rulează programul în cont Editorii de linkuri pot crea, de asemenea, fișiere obiect executabile parțial legate cu referințe nerezolvate la proceduri și date definite în biblioteca partajată În timpul încărcării, încărcătorul mapează executabilul parțial legat în memorie și apoi apelează încărcătorul dinamic, care finalizează sarcina de conectare prin încărcarea bibliotecii partajate și mutarea legăturilor în program Bibliotecile partajate care sunt compilate ca cod independent de poziție pot fi încărcate oriunde în spațiul de adrese și partajate în timpul rulării între mai multe procese Aplicațiile pot folosi, de asemenea, încărcătorul dinamic de rulare pentru a încărca, edita link-uri și accesa funcții și date din bibliotecile partajate Note bibliografice Editarea linkurilor este un subiect destul de prost documentat în literatura de specialitate a sistemelor informatice Deoarece acoperă compilatoare, arhitectura computerului și sistemele de operare, editarea legăturilor necesită o înțelegere a generării codului obiect, programarea în limbajul mașinii, implementarea programului și memoria virtuală Nu se încadrează în niciuna dintre specialitățile obișnuite din domeniul sistemelor informatice și astfel se dovedește că problemele clasice din acest domeniu de cunoaștere nu sunt bine acoperite în literatura de specialitate Totuși, monografia lui Levine [ ] oferă o introducere generală solidă a subiectului Specificațiile originale pentru ELF și DWARF (specificația pentru conținutul secțiunilor debug și line) sunt descrise în [ ] Putem observa o oarecare renaștere a activității de cercetare și comercială asociată conceptului de traducere binară (traducere binară), în care conținutul unui fișier obiect este analizat, analizat și modificat Translatarea binară poate fi folosită în trei scopuri diferite [ ]: pentru a emula un sistem pe alt sistem, pentru a observa comportamentul programului sau pentru a efectua optimizări dependente de sistem care nu sunt posibile în timpul compilării Capitolul Editarea legăturilor țiuni Programele comerciale precum VTune, Purify și BoundsChecker folosesc traducerea binară pentru a oferi programatorilor posibilitatea de a-și inspecta programele în detaliu Sistemul Atom [ ] oferă un mecanism flexibil pentru examinarea fișierelor obiect executabile și a bibliotecilor partajate în sistemul Alpha folosind funcții aleatorii ale limbajului C Atom a fost folosit pentru a construi o multitudine de analizoare care urmăresc apelurile de proceduri, reprezintă statistici de utilizare a comenzilor și în -scheme de referință la memorie (profiling), modelează comportamentul sistemului de memorie și localizează erorile de acces la memorie Etch [ ] și EEL [ ] oferă o estimare aproximativă a capacităților similare pe diferite platforme Sistemul Shade [ ] folosește translația binară pentru profilarea comenzilor Dynamo [ ] și Dyninst [ ] oferă mecanisme pentru explorarea în memorie și optimizarea modulelor executabile în timpul execuției Smith [ ] și colegii sai au explorat traducerea binară pentru profilarea și optimizarea programelor Sarcini pentru soluție acasă EXERCIȚIUL ♦ Luați în considerare următoarea versiune a funcției swap c, care numără de câte ori a fost apelată: unu cinci opt nouă unsprezece paisprezece cincisprezece optsprezece nouăsprezece douăzeci extern int int *bufp static int tampon[]; = &buf[ ]; *bufpl; static void incr() static int count = ; numără++; void swap() { inttemp; incr(); buffl = &buf[ ]; temp = *bufp ; *bufpo = *bufpl; *bufpl = temp; Partea a II-a Executarea programelor în sistem Pentru fiecare nume care este definit și referit în swap o, specificați dacă va avea o intrare în tabelul de nume din secțiunea symtab a modulului swap o Dacă da, atunci specificați modulul în care este definit acest nume (swap o sau main o), tipul numelui (local, global sau extern) și secțiunea ( text, data sau bss) pe care o ocupă în acest modul Nume Conectați-vă la symtab pentru swap o? Tip de nume Modul în care este definit numele Secțiunea EN ♦ Fără a modifica niciun identificator de variabilă, modificați bar c în Lista - , astfel încât foo c să imprime valorile x și y corecte (adică reprezentările hexazecimale ale numerelor întregi și ) EXERCIȚIUL ♦ În acest exercițiu, REF(xi) -> DBF(xk) înseamnă că linkerul va asocia o referință la numele x din modulul i cu definiția lui x din modulul k Utilizați această notație pentru fiecare exemplu pentru a indica cum ar face linkerul Rezolvați referințele la un nume definit multiplu în fiecare modul Pentru o eroare de timp de editare a linkului (regula ), scrieți „EROARE” Dacă editorul de linkuri alege în mod arbitrar una dintre definițiile posibile (regula ), scrieți „NECUNOSCUT” unu /* Modulul */ /* Modulul */ int main() static int main=l; { int p () } { } (a) REF(principal l) > DBF( ) (b) REF(principal ) > DBF( ) Capitolul Editarea legăturilor /* Modulul */ int main() ( i (a)REF(xl) —> DBF( (b)REF(x ) > DBF( /* Modulul */ int main() ( (a) REF(xl) > DBF( (b) REF(x ) > DBF( * Modulul */ dublu x; int p () { } ) ) /* Modulul */ dublu x= , ; int p () { } ) ) EXERCIȚIUL ♦ Luați în considerare următorul program, care constă din două module obiect: /* foo c */ void p (void); int main() cinci { p (); returnează ; opt } /* barb c */ #include caractere principale; cinci void p () { printf(" x%x\n", principal); nouă } Dacă acest program este compilat și rulat pe un sistem Linux, va tipări șirul „ x \n” și va ieși în mod normal, chiar dacă p nu inițializează niciodată variabila principală Puteți explica acest lucru? Partea a II-a Executarea programelor în sistem HPRJN EN I E ♦ Fie a și b să desemneze module obiecte sau biblioteci statice din directorul curent, iar a -> b să desemneze că a depinde de b, în sensul că b specifică numele referit de la a Pentru fiecare dintre următoarele scenarii, afișați linia de comandă minimă (care conține cele mai puține fișiere obiect și argumente de bibliotecă) care va permite linkerului static să rezolve toate referințele de nume: p o -> libx a -> p o p o -> libx a -> liby a și liby a -> libx a p o -> libx a -> liby a -> libz a și liby a -> libx a -> libz a NOTIFICARE I ♦ Puteți vedea din antetul segmentului din Lista - că acest segment de date ocupă x octeți în memorie Cu toate acestea, doar primii x octeți dintre ei aparțin secțiunii fișierului executabil Ce a cauzat această discrepanță? la PTAZHNENIIE M? ♦♦ Procedura de schimb din Lista - conține cinci referințe mutate Pentru fiecare referință mutată, dați numărul de linie din Lista - , adresa de memorie de rulare și valoarea acesteia Codul sursă și intrările de mutare din modulul swap o sunt afișate în codul de mai jos Număr de linie Adresă Sens : : împinge %ebp : b mov x ,%edx get *bufp =&buf[ ] : R bufpO intrare de călătorie : al mov x ,%eax get buf[l] : R intrare buf de deplasare s: e mov %esp,%ebp e: c movl $ x x bufpl = &buf[l]; : : R - intrare bupl deplasare : R - buf mutare intrare : es mov %ebp,%esp Capitolul Editarea legăturilor Ia: b a mov (%edx),%ecx temp = buf[ ]; s: mov %eax,(%edx) buf[ ]=buf[!];• e: al mov x ,%eax get *bufpl=&buf[ ] lf: intrare de călătorie R- - bupl : mov %ecx,(%eax) buf[l] = temp; : d POP %ebp : sz ret EXERCIȚII ♦♦♦ Luați în considerare codul C și modulul de obiect relocabil corespunzător de mai jos Determinați ce comenzi din text trebuie modificate de către linker atunci când modulul este mutat Pentru fiecare astfel de comandă, enumerați informațiile din intrarea sa de mutare: decalajul secțiunii, tipul de mutare și identificatorul numelui Determinați ce obiecte de date din data ar trebui modificate de către linker în timpul relocării modulului Pentru fiecare astfel de obiect, enumerați informațiile din intrarea sa de mutare: decalajul secțiunii, tipul de mutare și identificatorul numelui Utilizarea utilităților gratuite, cum ar fi objdump, vă va ajuta să finalizați acest exercițiu Un fragment din codul programului în limbaj C este următorul: extern int p (void); int x = ; int *xp = &x; void p (int y) { } void pl() { p (*xp + p ()); } Secțiunea text a fișierului obiect relocabil este după cum urmează: : : împinge %ebp : e mov %esp,%ebp : ec mov %ebp,%esp : d pop %ebp : c ret : : împinge %ebp : e mov %esp,%ebp Partea a II-a Executarea programelor în sistem b: ec sub $ x ,%esp e: c f adauga $ xffffffff ,%esp : e fc ff ff ff caii : c mov %eax,%edx : al mov x ,%eax Id: adaugă (%eax),%edx Dacă: apăsați %edx : e fc ff ff ff caii : ec mov %ebp,%esp : d POP %ebp : c ret Secțiunea data a unui fișier obiect relocabil arată astfel: : : : : Luați în considerare codul C și modulul de obiect relocabil corespunzător Determinați ce comenzi din text trebuie modificate de către linker atunci când modulul este mutat Pentru fiecare astfel de comandă, enumerați informațiile din intrarea sa de mutare: decalajul secțiunii, tipul de mutare și identificatorul numelui Determinați ce obiecte de date din rodata ar trebui modificate de către linker în timpul relocării modulului Pentru fiecare astfel de obiect, enumerați informațiile din intrarea sa de mutare: decalajul secțiunii, tipul de mutare și identificatorul numelui Utilizarea utilităților disponibile gratuit, cum ar fi objdump, vă va ajuta să finalizați acest exercițiu Un fragment din codul programului în limbaj C este următorul: int relo (int val) { comutator (val) { cazul : return(val); cazul : retur(val+ ); cazul : cazul : retur(val+ ); cazul : retur(val+ ); implicit: retur(val+ ); } paisprezece } Capitolul Editarea legăturilor Secțiunea text a fișierului obiect relocabil este după cum urmează: : : împinge %ebp : e mov %esp,%ebp : b mov x (%ebp),%eax : d s lea xffffff c(%eax), %edx : fa emp $ x ,%edx s: ja Ѳ e: ff jmp * x (,%edx, ) : inc %eax : eb jmp : cO adaugă $ x ,%eax b: eb b jmp ld: d lea x (%esi),%esi : cO adauga $ x ,%eax : eb jmp : cO adaugă $ x ,%eax : ec mov %ebp,%esp a: d pop %ebp b: c ret Secțiunea data a unui fișier obiect relocabil arată astfel: Acesta este tabelul de salt pentru instrucțiunea switch cuvinte cu decalaje x x x și Oxe cuvinte cu decalaje x și x EXERCIȚIU LA EN I E M? Următoarele sarcini vă vor ajuta să câștigați experiență în utilizarea diferitelor instrumente de procesare a fișierelor obiect Câte fișiere obiect sunt conținute în bibliotecile libc a și libm a de pe sistemul dumneavoastră? Vor diferi codurile modulelor de programe executabile atunci când sunt compilate într-un caz cu linia de comandă gcc - , iar în celălalt caz cu linia gcc - -g? Ce biblioteci partajate sunt folosite pe sistemul dumneavoastră? Soluție de exercițiu EXERCIȚIUL DE SOLUȚIE Scopul acestei sarcini este de a vă ajuta să vă familiarizați cu relația dintre numele de linker, pe de o parte, și variabile și funcții Partea a II-a Executarea programelor în sistem pe de altă parte Rețineți că în C, variabila locală temp nu are o intrare în tabelul de nume Nume Intrare swap o sau main o ? Tip de nume Ce modul definește Secțiunea buf da extern tpaip o data bufpO da schimb global O date buff da global swap O bss swap da global swap O text temp nu — — — SOLUȚIE^EXERCIȚIUL Această activitate este o practică simplă care testează înțelegerea dumneavoastră a regulilor de utilizare a linkerului Unix atunci când rezolvă referințele la nume globale care sunt definite în mai mult de un modul Înțelegerea acestor reguli vă poate ajuta să evitați unele greșeli de programare riscante Linker-ul selectează un nume bine definit din modulul printr-un nume slab definit aparținând modulului (regula ): REF(principal l) -> DEF(principal l) REF(principal ) -> DEF(principal l) Aceasta va fi „EROARE”, deoarece fiecare modul definește un NUME bine definit de principal (regula ) Linker-ul selectează numele puternic definit din modulul până la numele slab definit definit în modulul (regula ): REF(xl) > DEF(x ) REF(x ) —> DEF(x ) SOLUȚIE^EXERCIȚIUL Plasarea bibliotecilor statice în ordinea greșită pe linia de comandă este o sursă comună de erori de timp de editare a legăturilor care derutează mulți programatori Cu toate acestea, odată ce înțelegeți cum folosește linkerul bibliotecile statice pentru a rezolva legăturile, totul va fi la locul lui Acest mic exercițiu servește ca un test al înțelegerii tale a esenței acestei idei: gcc p o libx a gcc p o libx a liby a gcc p o libx a liby a libx a Capitolul Editarea legăturilor EXERCIȚIUL DE SOLUȚIE Această sarcină este legată de lista de dezasamblare Scopul nostru aici este să vă oferim puțină practică în citirea listelor de dezasamblare și să vă verificăm înțelegerea adresei relative la PC Adresa hexazecimală a legăturii mutate din linia este x b Valoarea hex a referinței mutate din linia este x Amintiți-vă că lista de dezasamblare arată valoarea de referință în ordinea octeților mici endian Punctul cheie aici este că, indiferent unde editorul de link-uri plasează secțiunea text, distanța dintre link și funcția de swap va fi întotdeauna aceeași Astfel, deoarece linkul este o adresă relativă la PC, valoarea sa va fi x , indiferent de locul unde editorul de link plasează secțiunea text SOLUȚIA EXERCITULUI Cum rulează de fapt programele C este un mister pentru majoritatea programatorilor Întrebările din această activitate vă controlează înțelegerea naturii procesului de pornire Le puteți răspunde utilizând vizualizarea codului de pornire : Fiecare program necesită o funcție principală deoarece codul de pornire comun tuturor programelor C prin convenție transferă controlul către funcția principală Dacă main iese prin executarea unei instrucțiuni return, atunci controlul este transferat înapoi la procedura de pornire, care returnează controlul sistemului de operare, prin apelarea exit Același proces are loc dacă utilizatorul omite declarația return Dacă principal iese prin apelarea exit, atunci exit revine în cele din urmă controlul sistemului de operare prin apelarea exit Rezultatul general este același în toate cele trei cazuri: la ieșirile principale, controlul este transferat înapoi în sistemul de operare CAPITOLUL Managementul excepțiilor □ Excepții □ Procese □ Apeluri de sistem și tratarea erorilor □ Managementul proceselor □ Semnale □ Transferuri non-locale de control □ Organizarea managementului proceselor □ Reluați Din momentul în care porniți procesorul și până în momentul în care îl opriți, contorul de programe va prelua o secvență de valori Oo, O/, , an-i, unde fiecare ak este adresa corespunzătoare unei instrucțiuni Fiecare trecere de la ak la ak avortul Prăbușiri Avorturile sunt rezultatul unor erori fatale irecuperabile Acestea sunt de obicei erori hardware, cum ar fi erori de paritate, care apar atunci când se pierde valoarea biților DRAM sau SRAM individuali Operatorii de blocare nu returnează niciodată controlul programului de aplicație După cum se arată în fig - , handlerul transferă controlul către subrutina de anulare, care încheie programul de aplicație ( ) Controlul este transmis operatorului ( ) Au apărut defecțiuni ~Icurr echipamente ( ) Gestionarea întreruperilor este executată „ > avorta ( ) Handler-ul returnează controlul la anularea programului Orez Tratarea accidentelor Excepții la procesoarele Intel Este mai ușor să vorbim despre lucruri specifice, așa că haideți să ne uităm la câteva excepții specifice platformei Intel Sistemele Pentium pot avea până la de tipuri diferite de excepții Numerele între și corespund excepțiilor definite de arhitectura Pentium și sunt astfel identice pe orice sistem din clasa Pentium Numerele din intervalul de la la corespund întreruperilor hardware și de sistem aparținând sistemului de operare În tabel prezintă câteva exemple O eroare de împărțire (Excepția ) apare atunci când o aplicație încearcă să împartă la zero sau când rezultatul unei instrucțiuni de împărțire este prea mare pentru operandul destinație Unix nu încearcă să corecteze erorile de divizare, preferând pur și simplu să anuleze programul Shell-urile Unix raportează de obicei erorile de diviziune ca „Eroare în virgulă mobilă” Partea a II-a, Rularea programelor pe sistem Tabelul Exemple de excepție Număr excepție Descriere Clasa de excepție Eroare de divizare Eșec Încălcare generală a securității Defecțiune Eroare de acces la pagină a eșuat Eroare de control hardware Crash - Excepții definite de sistemul de operare Întreruperea hardware sau a sistemului ( x ) Apeluri de sistem Întreruperea sistemului - Excepții definite de sistemul de operare Întreruperea hardware sau a sistemului Infama încălcare a securității generale (Excepția ) are loc dintr-o varietate de motive, de obicei deoarece programul face referire la o zonă nedefinită a memoriei virtuale sau atunci când programul încearcă să scrie într-un segment procedural doar pentru citire Unix nu încearcă să repare astfel de erori Shell-urile Unix raportează de obicei încălcări generale de securitate ca „Efect de segmentare” Pagina lipsă (Excepția ) este un exemplu de excepție în care comanda care a provocat eroarea va fi reexecută Handler-ul mapează pagina de memorie fizică corespunzătoare de pe disc la o pagină de memorie virtuală și apoi reexecută comanda care a cauzat eroarea În capitolul , vom arunca o privire mai atentă asupra modului în care funcționează acest mecanism O eroare de control hardware (Excepția ) apare ca urmare a unei erori hardware fatale și va fi detectată în timpul execuției instrucțiunii care a cauzat eroarea Managerii de erori de control hardware nu returnează niciodată controlul programului de aplicație Apelurile de sistem sunt furnizate pe sistemul A prin intermediul instrucțiunilor de captare INT l, unde indicele n poate fi oricare dintre cele de intrări din tabelul de excepții Din punct de vedere istoric, apelurile de sistem sunt efectuate prin excepția ( x ) Despre terminologie Terminologia în domeniul claselor de excepție nu este încă stabilită și variază de la sistem la sistem Specificațiile macroarhitecturii procesorului disting adesea între „întreruperi” asincrone și „excepții” sincrone, dar cu toate acestea nu există un termen generic pentru aceste concepte foarte asemănătoare Pentru a nu recurge constant la utilizarea sintagmelor „excepții și întreruperi” și „excepții sau întreruperi”, vom folosi cuvântul „excepție” ca termen general în aceste cazuri și vom face distincția între excepții asincrone (întreruperi hardware) ) și excepții sincrone (capcane, blocări și întreruperi), dar numai atunci când are sens După cum sa menționat deja, Capitolul Gestionarea excepțiilor Elementele de bază rămân aceleași pentru orice sistem, dar rețineți că unii dezvoltatori folosesc cuvântul „excepție” în manualele lor pentru a se referi numai la modificările fluxului de control care sunt declanșate de evenimente sincrone Procesele Excepțiile sunt unul dintre acele „blocuri de construcție” care sunt folosite pentru a construi și dezvolta una dintre cele mai fructuoase și de succes idei din informatică - conceptul de proces în sistemele de operare Atunci când un program este lansat într-un cont într-un sistem informatic modern, se creează iluzia că în momentul actual acest program va fi singurul care se execută în acest sistem Acest program pare să aibă monopol atât pe CPU, cât și pe memorie Procesorul, s-ar părea, execută instrucțiunile programului secvenţial unul după altul, fără întreruperi În cele din urmă, se creează iluzia că nu există alte obiecte în memoria sistemului cu excepția codului programului și a datelor acestui program Aceste iluzii sunt create prin conceptul de proces În mod tradițional, un proces este definit ca o instanță a unui program care se execută Fiecare program din sistem este executat în contextul unui proces Contextul este o structură care permite programului să se execute corect Această structură include codul programului și datele stocate în memorie, stiva programului, conținutul registrelor sale de uz general, contorul programului, variabilele de mediu de rulare și un set de descriptori de fișier deschis De fiecare dată când utilizatorul rulează un program pe un cont prin tastarea numelui unui fișier obiect executabil pe linia de comandă, shell-ul generează un nou proces și apoi rulează acel fișier obiect executabil pe cont în contextul acelui proces nou Programele de aplicație pot genera, de asemenea, noi procese și, în contextul acestor noi procese, rulează propriul cod de program sau alte aplicații pe cheltuială O discuție detaliată despre modul în care procesele sunt implementate în sistemele de operare depășește scopul acestui subiect În schimb, ne vom concentra asupra următoarelor probleme cheie privind aplicarea procesului: □ flux logic autonom de control, care creează iluzia că programul are utilizarea exclusivă a procesorului; □ un spațiu de adresă privat care creează iluzia că programul folosește exclusiv sistemul de memorie Să luăm în considerare aceste întrebări mai detaliat Flux de control logic Un proces dă iluzia că fiecare program are utilizarea exclusivă a procesorului, chiar dacă există mai multe alte programe care rulează pe sistem Dacă ar fi să folosim depanatorul în modul pas, am putea observa secvența Partea a II-a Executarea programelor în sistem O valoare a contorului de program (PC) care ar corespunde exclusiv instrucțiunilor conținute în fișierul obiect executabil al programului nostru sau în obiectele partajate legate dinamic de programul nostru în timpul rulării Această secvență de valori PC se numește fluxul logic de control Luați în considerare un sistem care rulează trei procese, așa cum se arată în Fig Singurul fir fizic de control al procesorului este împărțit în trei fire logice, câte unul pentru fiecare proces Fiecare linie verticală reprezintă o porțiune din fluxul logic pentru un proces În acest exemplu, procesul A rulează o perioadă de timp, apoi urmează B, care rulează până când se finalizează Apoi procesul C rulează pentru o perioadă, apoi urmează procesul A, care rulează până când se încheie În cele din urmă, procesul C este lăsat să ruleze până când se încheie Procesul A Procesul B Procesul C Orez Fluxuri de control logic Punctul cheie din fig este că procesele se succed atunci când se utilizează procesorul Fiecare proces execută o parte din firul său și apoi este întrerupt (suspendat temporar), în timp ce alte procese preiau controlul Un program care rulează în contextul unuia dintre aceste procese pare să aibă utilizarea exclusivă a procesorului Singurul lucru care nu poate fi pus la îndoială este că dacă am măsura cu precizie timpul petrecut de fiecare instrucțiune (vezi capitolul ), am fi atenți la faptul că procesorul central părea să se oprească periodic între execuția unor instrucțiuni de program Cu toate acestea, de fiecare dată când procesorul „se oprește”, acesta reia ulterior execuția programului fără nicio modificare a conținutului adreselor sau registrelor memoriei programului În general, fiecare fir logic este independent de toate celelalte fire, în sensul că firele logice asociate cu procese diferite nu afectează reciproc stările Singura excepție de la această regulă apare atunci când procesele folosesc mecanisme de comunicare între procese (IPC) cum ar fi conducte, socluri, memorie partajată și semafoare pentru a comunica în mod explicit între ele Orice proces al cărui flux logic se intersectează în timp cu fluxul altuia se numește proces paralel și spunem că cele două procese se execută în același timp De exemplu, în fig A și B sunt executate simultan, Capitolul Gestionarea excepțiilor de asemenea, A și C Pe de altă parte, B și C nu sunt executate în același timp, deoarece ultima comandă a lui B este executată înaintea primei comenzi a lui C Conceptul proceselor care se succed unul altuia se află în centrul multitasking-ului Fiecare interval de timp în care procesul își execută partea sa din fir se numește interval de timp Astfel, modul multitasking poate fi numit și modul time slicing Spațiu de adrese închis Procesul creează, de asemenea, iluzia că fiecare program folosește exclusiv spațiul de adrese al sistemului Pe o mașină cu „adrese de biți, spațiul de adrese este de ” adrese posibile, , , , n- Un proces oferă fiecărui program propriul spațiu de adrese privat Acest spațiu se numește privat în sensul că orice memorie de octeți asociată cu o anumită adresă din acest spațiu are proprietatea că nu poate fi accesată (citită sau scrisă) din niciun alt proces Deși conținutul memoriei asociat cu un spațiu de adrese privat va fi în general diferit, structura generală a fiecărui astfel de spațiu va fi aceeași Oxffffffff Ohsoooooooo x x Memorie virtuală kernel Î Stivă personalizată (în timpul rulării) t Zona de memorie pentru biblioteci partajate î Memoria dinamică (creată de maiioc) Segment de citire și scriere ( data, bss) Segment de numai citire ( init, text, rodata) Nefolosit Invizibil pentru codul utilizatorului %esp (indicator de stivă) brk Încărcat din executabil Orez Procesează spațiul de adrese De exemplu, în fig Figura prezintă structura spațiului de adrese pentru procese în Linux Cele trei sferturi de jos din spațiul de adrese sunt rezervate Partea a II-a Executarea programelor în sistem Sunt pentru programe de utilizator cu text, date și segmente normale de stivă Sfertul superior al spațiului de adrese este rezervat nucleului de sistem Această porțiune a spațiului de adrese conține codul programului, datele și stiva pe care nucleul le folosește atunci când execută o instrucțiune în numele unui proces (de exemplu, când un program de aplicație execută un apel de sistem) Personalizat și moduri privilegiate Pentru ca nucleul sistemului de operare să suporte modelul de proces impenetrabil, procesorul trebuie să ofere un mecanism pentru limitarea setului de instrucțiuni executate de aplicație, precum și limitarea porțiunii din spațiul de adrese disponibil Procesoarele oferă de obicei această capacitate prin utilizarea bitului de mod din registrul de control, care determină privilegiile pe care le are procesul în prezent Când bitul de mod este setat, procesul va rula în modul privilegiat (uneori numit modul supervizor) Un proces care se execută în modul privilegiat poate executa oricare dintre seturile disponibile de comenzi, precum și poate accesa orice adresă de memorie din sistem Dacă bitul de mod nu este setat, procesul va rula în modul utilizator În modul utilizator, un proces nu poate executa instrucțiuni privilegiate care efectuează operațiuni precum oprirea procesorului, schimbarea unui bit de mod sau inițierea unei operații I/O De asemenea, nu are capacitatea de a face referire directă la codul programului sau datele dintr-o regiune a spațiului de adrese al nucleului Orice astfel de încercare se încheie cu o eroare de securitate fatală Pentru a efectua astfel de operațiuni, programele utilizator trebuie să acceseze codul kernelului și datele indirect prin interfața de apel de sistem Procesul care execută codul aplicației în starea sa inițială este în modul utilizator Singura modalitate de a schimba modul unui proces în privilegiat este să aruncați o excepție, cum ar fi o întrerupere, o blocare sau un apel de sistem Dacă apare o excepție și controlul este transferat la gestionarea excepțiilor, procesorul își schimbă modul de la utilizator la privilegiat Handler-ul este executat în modul privilegiat Când controlul revine la codul aplicației, procesorul schimbă modul de la privilegiat înapoi la utilizator Linux și Solaris oferă un mecanism inteligent, sistemul de fișiere /proc, pentru a permite proceselor în modul utilizator să acceseze conținutul structurilor de date ale nucleului Sistemul de fișiere /proc exportă conținutul multor structuri de date ale nucleului, cum ar fi ierarhia fișierelor ASCII, care poate fi citită de programele utilizatorului De exemplu, puteți utiliza /proc pe sistemul de fișiere Linux pentru a obține ajutor cu caracteristicile generale ale sistemului, cum ar fi tipul de procesor (/proc/cpuinfo) sau segmentele de memorie utilizate de un anumit proces (/proc/ /hărți) Capitolul Gestionarea excepțiilor Schimbă de context Nucleul sistemului de operare implementează multitasking folosind o formă de transfer de excepții la nivel înalt cunoscut sub numele de comutare de context Mecanismul de schimbare a contextului este un supliment la mecanismul de excludere de nivel scăzut despre care am discutat în Sec Nucleul menține un context pentru fiecare proces Contextul este o structură de stare pe care nucleul trebuie să o restabilească atunci când reia execuția unui proces întrerupt Include valorile următoarelor obiecte: □ registre de uz general; □ registre în virgulă mobilă; □ contor de comenzi; □ stivă personalizată; □ registre de stare; □ stivă de nucleu; □ tabel de pagini, care definește spațiul de adrese; □ tabel de proces, care conține informații despre procesul curent; □ tabel de fișiere, care conține informații despre fișierele deschise de proces În timpul execuției unui proces, nucleul poate decide să întrerupă procesul curent în anumite puncte și apoi să reia execuția procesului întrerupt anterior Acest comportament se numește programare de activare și este gestionat de codul din nucleu numit planificator Dacă nucleul alege un nou proces pentru a rula, spunem că nucleul intenționează să declanșeze un proces După ce nucleul programează activarea unui nou proces, acesta încheie procesul curent și transferă controlul noului proces folosind un mecanism numit comutare de context În acest caz, contextul procesului curent este salvat, contextul salvat al unui proces întrerupt anterior este restaurat, controlul este transferat acestui proces nou restaurat O schimbare de context poate apărea atunci când nucleul execută un apel de sistem în numele utilizatorului Dacă apelul de sistem este blocat deoarece așteaptă un eveniment, atunci nucleul poate trimite procesul curent în repaus și poate comuta la un alt proces De exemplu, dacă apelul de sistem de citire necesită acces la disc, atunci nucleul poate alege să comute contextul și porniți un alt proces în loc să așteptați ca datele să fie primite de pe disc Un alt exemplu este apelul sistemului de repaus, care pune procesul în mod explicit în repaus În general, chiar dacă apelul de sistem nu este blocat, nucleul poate decide să efectueze un comutare de context în loc să returneze controlul procesului de apelare O schimbare de context poate apărea și ca urmare a unei întreruperi De exemplu, unele sisteme au diferite mecanisme pentru generarea de întreruperi periodice ale temporizatorului, de obicei la fiecare ms De fiecare dată când se întâmplă Partea a II-a Executarea programelor în sistem Dacă se declanșează o întrerupere a temporizatorului, nucleul poate decide că procesul curent a rulat suficient de mult și poate comuta execuția la noul proces Pe fig Figura prezintă un exemplu de comutare de context între o pereche de procese A și B În acest exemplu, procesul A rulează inițial în modul utilizator până când trimite o solicitare către nucleu pentru a executa apelul de sistem de citire Managerul de întrerupere a nucleului solicită un transfer DMA către controlerul de disc și aranjează ca controlerul de disc să întrerupă procesorul după ce acesta a terminat de transferat date de pe disc în memorie Este nevoie de un timp relativ lung (de ordinul a zeci de milisecunde) pentru ca discul să preia date, așa că, în loc să aștepte inactiv, nucleul efectuează o comutare de context de la procesul A la procesul B Rețineți că nucleul execută comenzi în utilizator modul în numele procesului A În timpul primei faze a comutării, nucleul execută comenzi în modul privilegiat în numele procesului A Apoi, la un moment dat, începe să execute comenzi (încă în modul privilegiat) din partea procesului B, iar după comutarea finalizată, nucleul va începe să execute comenzi în modul utilizator în numele procesului B Procesul B rulează apoi în modul utilizator pentru o perioadă, până când discul trimite un semnal de întrerupere pentru a indica faptul că datele au fost transferate cu succes de pe disc în memorie Nucleul decide că procesul B a rulat suficient de mult și efectuează o comutare de context de la procesul B la procesul A, returnând controlul comenzii imediat după apelul de sistem de citire în procesul A Procesul A continuă să ruleze până când apare următoarea excepție și etc Înfundarea kosh și transferul controlului prin excepție În general, memoria cache hardware nu este concepută pentru a face față mecanismelor de transfer de excepții care cauzează întreruperi și schimbări de context Dacă procesul curent este întrerupt, atunci memoria cache devine indisponibilă pentru gestionarea întreruperilor Dacă manipulatorul este reciproc Capitolul : Gestionarea excepțiilor funcționează cu un segment de RAM suficient de mare, apoi cache-ul devine și el inaccesibil pentru procesul întrerupt - în momentul în care își reia execuția În acest caz, spunem că handlerul poluează memoria cache Un fenomen similar are loc atunci când se utilizează comutatoarele de context În momentul în care un proces își reia execuția după o schimbare de context, cache-ul devine inaccesibil aplicației și trebuie reconstruit Apeluri de sistem și tratarea erorilor Sisteme precum Unix oferă o mare varietate de apeluri de sistem care pot fi utilizate de programele de aplicație prin solicitarea de servicii de la kernel, cum ar fi citirea unui fișier sau generarea unui nou proces De exemplu, Linux oferă aproximativ de apeluri de sistem Dacă tastați „man syscalls” veți obține o listă completă a acestora Orice apel de sistem poate fi efectuat dintr-un program C direct folosind macro-ul syscali descris în „man intro” Cu toate acestea, de obicei, nu este necesar să efectuați apeluri de sistem direct, de fapt, este chiar nedorit Biblioteca standard C oferă un set de funcții de wrapper convenabile pentru apelurile de sistem cele mai frecvent utilizate Funcțiile pachetului acceptă argumente, generează o capcană în nucleu prin inițierea apelului de sistem corespunzător și apoi transmit starea de returnare a apelului de sistem înapoi programului apelant În discuțiile noastre din secțiunile următoare, uneori ne vom referi la apelurile de sistem și la funcțiile de înveliș asociate acestora ca funcții la nivel de sistem Dacă funcțiile Unix la nivel de sistem întâmpină erori, de obicei returnează - și setează variabila întreg global eggpo pentru a indica că apelul funcției a eșuat Programatorii ar trebui să ia întotdeauna măsuri pentru a urmări erorile, dar, din păcate, mulți ocolesc verificarea erorilor, deoarece face codul să se umfle și să fie greu de citit De exemplu, iată cum puteți urmări erorile atunci când apelați funcția Unix fork: dacă ((pid = furcă ()) #include pid t getpid(void); pid t getppid(void); Rutinele getpid și getppid returnează o valoare întreagă de tip pid t, care este definită ca int în types h pe sistemele Linux Procese de generare și terminare Din punctul de vedere al unui programator, vă puteți imagina că un proces se află în una dintre cele trei stări: □ Un proces care rulează fie rulează pe CPU, fie este într-o stare de așteptare pentru o situație în care va fi selectat în cele din urmă pentru activare □ Suspendat - activarea acestuia nu va fi programată Procesul este oprit prin primirea unuia dintre semnalele SIGSTOP, SIGTSTP, S GTTIN sau SIGTTOU și rămâne suspendat până la recepționarea semnalului SIGCONT, după care continuă să execute din același punct Un semnal este o formă de întrerupere software, care este descrisă în detaliu în Sec □ Procesul finalizat s-a oprit definitiv Un proces se încheie din unul dintre cele trei motive: primirea unui semnal a cărui acțiune standard este de a încheia procesul; revenirea din subrutina principală sau un apel la funcția de ieșire #include void exit(int status); Funcția de ieșire încheie procesul setând starea la valoarea stării de ieșire O altă modalitate de a seta starea de ieșire este să returnezi o valoare întreagă din subrutina principală Procesul părinte generează un nou proces copil care rulează apelând funcția fork #include flinclude pid t furk(void); Funcția returnează pentru procesul copil, PID-ul procesului copil pentru părinte și - la eroare Procesul copil nou creat este aproape, dar nu chiar, identic cu cel părinte Procesul copil devine o copie identică (dar separată) a părintelui în spațiul de adrese virtuale la nivel de utilizator, inclusiv text, date și segmente bss, memoria dinamică și stiva de utilizator copil pro Partea a II-a Executarea programelor în sistem Procesul primește, de asemenea, copii identice ale tuturor descriptorilor de fișier deschis ai părintelui, ceea ce înseamnă că procesul copil poate citi și scrie în toate fișierele care au fost deschise în procesul părinte când a apelat fork Cea mai semnificativă diferență între un părinte și un copil nou născut este că au PID-uri diferite Funcția fork este interesantă (dar adesea greșit înțeleasă) prin faptul că este apelată o dată, dar revine de două ori: o dată la procesul de apelare (părinte) și o dată la procesul copil nou generat În procesul părinte, fork returnează PID-ul procesului copil, în procesul copil, fork returnează valoarea Deoarece PID-ul procesului copil este întotdeauna diferit de zero, valoarea returnată indică fără ambiguitate dacă este destinată părintelui proces sau procesul copil Lista arată un exemplu simplu de proces părinte care utilizează fork pentru a genera un proces copil În momentul în care se întoarce fork (linia ), x are valoarea atât în procesele părinte, cât și în cele secundare Procesul copil crește valoarea și tipărește o copie a lui x (linia ) În mod similar, procesul părinte decrește valoarea și tipărește o copie a lui x (linia ) R Lista Procese părinte și copil #include „csapp h” int main() { pid t pid; int x = ; pid = Furcă (); if (pid = ) { /* proces copil */ printf("copil : x=%d\n", ++x); ieșire (O); } /♦ proces părinte */ printf("părinte: x=%d\n", -x); ieșire( ); } Rularea acestui program pe un sistem Unix va produce următoarele rezultate: unix> /furcă părinte: x= copil : x= Capitolul : Gestionarea excepțiilor În acest exemplu simplu, pot fi remarcate câteva caracteristici interesante: □ Sunat o singură dată, dar returnat de două ori Funcția fork este apelată o dată de părinte, dar revine de două ori, o dată la părinte și o dată la copilul nou creat Acest lucru este destul de evident pentru programele care generează un singur proces copil Dar programele cu mai multe instanțe de fork pot deveni confuze și ar trebui tratate în detaliu □ Execuție paralelă Procesele părinte și copil sunt procese diferite care rulează în același timp Nucleul sistemului poate intercala aleatoriu execuția comenzilor în firele lor logice de control Când acest program este executat pe sistemul nostru, procesul părinte completează mai întâi instrucțiunea printf, urmată de procesul copil Cu toate acestea, ordinea inversă este posibilă în alt sistem În general, programatorii nu ar trebui să facă niciodată presupuneri cu privire la ordinea în care comenzile sunt executate de diferite procese □ Spații de adrese identice, dar separate Dacă am putea opri procesele părinte și subordonate imediat după revenirea fork-ului în fiecare proces, am vedea că spațiile de adrese ale acestor procese sunt identice Fiecare dintre procese are aceleași stive de utilizator, aceleași valori pentru variabilele locale, aceleași valori pentru variabilele globale și aceleași coduri de program Astfel, în programul nostru exemplu, variabila locală x are valoarea atât în procesele părinte, cât și în cele secundare, în momentul în care funcția fork revine (linia ) Cu toate acestea, deoarece procesele părinte și secundare sunt procese separate, fiecare are propriile spații de adrese private Orice modificări ulterioare ale variabilei x care sunt făcute în procesul părinte sau copil sunt închise și nu se reflectă în memoria celuilalt proces Acesta este motivul pentru care variabila x are valori diferite în procesele părinte și copil atunci când își numesc propriile instrucțiuni printf □ Fișiere partajate Rețineți că, atunci când programul exemplu este executat, atât procesele părinte, cât și cele secundare își scot rezultatele pe același ecran Acest lucru este posibil deoarece procesul copil moștenește toate fișierele deschise ale părintelui Când procesul părinte apelează fork, fișierul stdout va fi deschis și rezultatul va fi direcționat către ecran Procesul copil va moșteni acest fișier și astfel ieșirea lui va fi direcționată și către ecran La început, când se învață funcția de furcă, este adesea util să schițezi un grafic de proces în care fiecare săgeată orizontală să corespundă unui proces care execută comenzi de la stânga la dreapta, iar fiecare săgeată verticală să corespundă execuției funcției de furcă De exemplu, câte linii de ieșire poate programa în Lista din Figura arată graficul procesului corespunzător Procesul părinte generează un proces copil la prima (și singura) execuție a unui fork într-un program Partea a II-a Executarea programelor în sistem Fiecare apelează printf o dată, astfel încât programul imprimă două linii de ieșire #include „csapp h” int main() { Furca(); printf("bună ziua!\n"); ieșire (O); opt } bună bună furculiţă Orez Sunt ieșite două linii de ieșire Acum să presupunem că vrem să apelăm fork de două ori, așa cum se arată în Listarea După cum se poate observa din fig În Figura - , părintele apelează fork pentru a genera un copil, iar apoi atât părintele, cât și copilul furk, dând încă două procese Astfel, există patru procese, fiecare apelând printf, astfel încât programul generează patru linii de ieșire #include „csapp h” int main() { Furca(); ForkO; printf("bună ziua!\n"); ieșire (O); nouă } Buna ziua Buna ziua l ► Buna ziua Buna ziua furca furca Orez Sunt ieșite patru linii de ieșire Capitolul Gestionarea excepțiilor Continuând în aceeași direcție, să ne întrebăm, ce se întâmplă dacă apelăm la furcă de trei ori, ca în Listarea ? După cum se poate observa din graficul procesului din fig , acum numărul total de procese a ajuns la opt Fiecare proces apelează printf, astfel încât programul produce opt linii de ieșire #include „csapp h” int main() { Furca(); Furca(); Furca(); printf("bună ziua!\n"); exit( ); } Orez Sunt ieșite opt linii de ieșire Luați în considerare următorul program: #include „csapp h” int main() { int X e ; dacă (Fork() == ) printf("printf : x=%d\n", ++x); printf("printf : x=%d\n", -x); ieșire( ); unsprezece } Partea a II-a Executarea programelor în sistem Care va fi rezultatul procesului copil? Care va fi rezultatul procesului părinte? HP N EJH ȘI ? - Câte rânduri de „heilo” vor fi tipărite de acest program? #include „csapp h” int main() { int i; opt nouă pentru(i= ;i #include pid t waitpid(pid t pid, int *status, int opțiuni); Funcția returnează PID-ul procesului copil dacă totul este în ordine, (dacă WNOHANG), în caz contrar - în cazul unei erori În mod implicit (când opțiunile = ), waitpid suspendă execuția procesului de apel până când procesul copil din setul său de așteptare se termină Dacă procesul din setul de așteptare sa încheiat deja în momentul solicitării, atunci waitpid-ul este returnat imediat În ambele cazuri, waitpid returnează PID-ul procesului copil încheiat, iar procesul copil încheiat va fi eliminat din sistem Membrii setului de așteptare sunt definiți folosind parametrul pid: □ Dacă pid > , atunci setul de așteptare este un singur proces copil al cărui ID este pid □ Dacă pid = - , atunci setul de așteptare include toate procesele copil ale părintelui Seturi de procese de așteptare Funcția waitpid acceptă și alte tipuri de seturi de așteptare, inclusiv grupuri de procese Unix, pe care nu le vom acoperi aici Modificarea comportamentului implicit Puteți modifica comportamentul implicit setând variabila opțiuni la diferite combinații logice ale valorilor constantelor WNOHANG și WUNTRACED: □ WNOHANG - Returnează imediat (cu o valoare returnată de ) dacă niciunul dintre procesele secundare din setul de așteptare nu a ieșit încă Partea a II-a Executarea programelor în sistem □ WUNTRACED - Suspend execuția procesului de apelare până când procesul din setul de așteptare este terminat sau oprit Returnează PID-ul procesului copil încheiat sau oprit care a provocat această returnare □ WNOHANG I WUNTRACED - Suspendați execuția procesului de apelare până când procesul copil din setul de așteptare iese sau se oprește, apoi returnează PID-ul procesului copil suspendat sau ieșit care a determinat revenirea acestuia De asemenea, reveniți imediat (cu o valoare returnată de ) dacă niciunul dintre procesele din setul de așteptare nu s-a încheiat sau s-a oprit deja Verificarea stării de ieșire a unui proces de copil ucis Dacă se dovedește că argumentul status nu este NULL, atunci waitpid codifică în argumentul status informații despre starea procesului copil care a provocat returnarea Fișierul include wait h conține mai multe macrocomenzi pentru interpretarea argumentului de stare: □ WIFEXITED returnează true dacă procesul copil a ieșit normal, fie apelând exit, fie utilizând return □ WEXITSTATUS returnează starea de ieșire a unui proces copil încheiat în mod normal Această stare este determinată numai dacă WIFEXITED a returnat adevărat □ WIFSIGNALED returnează adevărat dacă procesul copil a ieșit deoarece semnalul nu a fost captat □ WTERMSIG returnează numărul semnalului care a determinat terminarea procesului copil Această stare este determinată numai dacă WIFSIGNALED a returnat adevărat □ WIFSTOPPED returnează adevărat dacă procesul copil care a cauzat returnarea este oprit în prezent □ WSTOPSIG returnează numărul semnalului care a determinat oprirea procesului copil Această stare este determinată numai dacă WIFSTOPPED a returnat adevărat Stări de eroare Dacă procesul de apelare nu are procese copil, atunci waitpid returnează - și setează egrpo la ECHILD Dacă funcția waitpid a fost întreruptă de un semnal, returnează - și setează egpo la valoarea EINTR Constante legate de funcțiile Unix Constante precum WNOHANG și WUNTRACED sunt definite în fișierul antet al sistemului HANG și WUNTRACED sunt definite (indirect) în fișierul antet wait h: Capitolul Gestionarea excepțiilor /★ biți în al treilea parametru waitpid */ tdefine WNOHANG /* nu blocați așteptarea */ Idefine WUNTRACED /* raportează starea proceselor copil oprite */ Pentru a utiliza aceste constante, fișierul de antet wait h trebuie inclus în cod: #include Pagina de manual pentru fiecare funcție Unix conține o listă de fișiere antet care trebuie incluse ori de câte ori acea funcție este utilizată într-un program În plus, errno h ar trebui inclus, astfel încât codurile de returnare precum ECHILD și EINTR să poată fi verificate Pentru a simplifica exemplele de programare, includem un singur fișier antet, csapp h, care include fișierele antet pentru toate funcțiile utilizate în această carte Fișierul antet csapp h este conținut în anexa Exemple Lista arată un program care generează N procese copil, folosește waitpid pentru a aștepta ca acestea să se termine și apoi verifică starea de ieșire a fiecărui proces copil terminat #include „csapp h” fdefini N int { - main () int status, i; pid t pid; pentru (i = ; i ) { if (WIFEXITEDfstatus)) printf("copilul %d terminat normal cu starea de ieșire=% d\ n", pid, WEXITSTATUS(status)); else printf("copilul %d terminat anormal\n", pid); } if (errno != ECHILD) unix error("eroare waitpid"); Partea a II-a Executarea programelor în sistem ieșire (O); } Dacă rulăm acest program pe un sistem Unix, rezultatul va fi următorul: unix> /waitpidl copilul terminat normal cu starea de ieșire= copilul terminat normal cu starea de ieșire= Rețineți că programul nu ucide procesele copil într-o anumită ordine Lista arată cum ar putea fi folosit waitpid pentru a distruge procesele copil din Lista în aceeași ordine în care au fost generate de părinte Strălucitor Eliminarea proceselor copil în ordinea în care sunt generate - \r 'xh #include „csapp h” #definiți N int main() cinci { int status, i; pid t pid[N+l], retpid; opt pentru (i = ; i ) { dacă (WIFEXITED(stare)) printf("copilul %d terminat normal cu starea de ieșire=%d\n", retpid, WEXITSTATUS(status)); altfel printf("copilul %d terminat anormal\n", retpid); } /* terminarea normală este posibilă dacă nu mai există fără procese copil */ dacă (errno != ECHILD) unix error("eroare waitpid"); ieșire( ); } Capitolul Gestionarea excepțiilor EXERCIȚIUL Luați în considerare următorul program: #include „csapp h” int main() { stare int; pid t pid; printf("Bună ziuaXn"); pid = Furcă (); printf("%d\n", !pid); dacă (pid != ) { dacă (waitpid(- , &status, ) > ) ( dacă (WIFEXITED(stare) != ) printf("%d\n", WEXITSTATUS(stare)); cincisprezece } } printf("La revedere\n"); ieșire( ); nouăsprezece } Câte linii de ieșire vor fi generate de acest program? Specificați una dintre posibilele ordine de ieșire pentru aceste șiruri Adormirea proceselor Funcția de somn suspendă procesul pentru o anumită perioadă de timp #include unsigned int sleep(unsigned int secs); Funcția de somn returnează zero dacă timpul solicitat a trecut, iar numărul de secunde „nedormite” în caz contrar Ultimul caz este posibil dacă funcția de somn execută prematur operația de întoarcere Și asta se întâmplă atunci când este întrerupt de un semnal Semnalele vor fi discutate mai detaliat în Sec O altă funcție utilă este funcția de pauză, care pune funcția de apelare în somn până când procesul primește un semnal #include int pauză(void); Funcția returnează întotdeauna - Partea a II-a Executarea programelor în sistem EXERCIȚIUL Scrieți o funcție de înfășurare a somnului numită snooze cu următoarea interfață: unsigned int snooze(unsigned int secs); Funcția de amânare se comportă exact ca și funcția de somn, cu excepția faptului că tipărește un mesaj care oferă o indicație despre cât timp a stat de fapt procesul de somn: dormit timp de din secunde Încărcarea și rularea programelor pentru execuție Funcția exec încarcă și rulează un nou program pe cont în contextul procesului curent #include int execve(char *nume fișier, char *argv[], char *envp); Nu se întoarce la procesul de apelare la succes și returnează - la eroare Funcția exec încarcă și execută în cont un fișier obiect executabil nume de fișier cu o listă de parametri argv și o listă de variabile de rulare epvp Funcția exec returnează controlul programului apelant numai dacă apare o eroare, cum ar fi absența unui fișier cu numele dat Prin urmare, spre deosebire de funcția fork, care este apelată o dată, dar returnează de două ori, exexe este apelată o dată și nu se întoarce niciodată Lista parametrilor este reprezentată de structura de date prezentată în fig Variabila argv indică către o matrice de pointeri terminată în nul, fiecare indicând șirul de argumente Prin convenție, argv[ ] este numele unui fișier obiect executabil Lista variabilelor de mediu runtime este reprezentată de o structură de date similară, prezentată în fig Variabila epv indică o matrice terminată în nul de pointeri către șiruri de variabile de rulare, fiecare dintre acestea fiind o pereche nume și valoare de forma „nume=valoare” argv axgv[] Orez Organizarea listei de parametri După ce exec a încărcat numele fișierului, apelează codul de pornire descris în sec Codul de pornire setează stiva și transferă controlul către subrutina principală a noului program, al cărui prototip este de forma int main(int argc, char **argv, char **envp); Capitolul Gestionarea excepțiilor sau, echivalent, int main(int argc, char *argv[], char *envp[]); envp envp[] envp[ ] envpțl] >|,,PWD-/uar/droh"| "IMPRIMANTE-fier" | envpțn - ] NUL >>| „UTILIZATOR-droh” | Orez Organizarea listei de variabile runtime Când main începe să se execute pe un sistem Linux, stiva de utilizatori va avea organizarea prezentată în Fig Să mergem de la partea de jos a stivei (cea mai înaltă adresă) la sus (cea mai joasă adresă) Mai întâi vor fi șirurile de argument și de execuție, care sunt stocate unul lângă altul pe stivă, secvenţial unul după altul, fără goluri Urmează în acea direcție o matrice de pointeri terminată în nul, fiecare indicând una dintre variabilele șirului de rulare din stivă Primul dintre acești indicatori epvar[ ] este indicat de variabila globală environ Matricea de pointeri de rulare este urmată imediat de o matrice argv[ terminată în nul, fiecare element indicând unul dintre șirurile de argumente din stivă Orez Organizarea tipică a stivei de utilizatori în momentul pornirii unui nou program Partea a II-a Executarea programelor în sistem În partea de sus a stivei se află cele trei argumente pentru principal: epvar indicând matricea epvar[ ] argv indicând matricea argv[] argc, care oferă numărul de pointeri non-nuli din tabloul argv[] Unix oferă câteva funcții pentru gestionarea matricei de rulare: ttinclude char *getenv(const char *nume); Funcția getenv caută în matricea de rulare șiruri de caractere de forma „nume = valoare” Dacă șirul este găsit, funcția returnează un pointer la valoare, în caz contrar, returnează NULL ttinclude int setenv(const char *nume, const char *newvalue, int overwrite); Funcția setenv returnează la succes, - la eroare void unsetenv(const char *nume); Funcția unsetenv nu returnează nimic Dacă matricea de rulare conține un șir de forma „name=oldvalue”, atunci unsetenv îl elimină și setenv înlocuiește oldvalue cu newvalue, dar numai dacă overwrite este diferit de zero Dacă calea nu există, atunci setenv adaugă elementul „name=newvalue” la matrice Setarea variabilelor de mediu de rulare pe un sistem Solaris În loc de funcția setenv, Solaris oferă funcția putenv Dar nu are niciun analog al funcției unsetenv Programe și procese Acesta este locul potrivit pentru a vă opri și a verifica singur dacă ați stăpânit suficient de bine diferențele dintre un program și un proces Un program este o colecție de cod de program și date; programele pot exista ca module obiecte pe disc sau ca segmente într-un spațiu de adrese Un proces este o instanță specifică a unui program în execuție; programul este întotdeauna executat în contextul unui proces Înțelegerea acestei diferențe este importantă dacă doriți să înțelegeți funcțiile fork și exec Funcția fork execută același program într-un nou proces copil care este un duplicat al părintelui Funcția exec încarcă și rulează un nou program pe cont în contextul procesului curent Deși suprascrie spațiul de adrese al procesului curent, această funcție nu generează un nou proces Noul program are în continuare același PID și moștenește toți descriptorii de fișier care erau deschiși în momentul în care a fost apelată funcția exec Capitolul Gestionarea excepțiilor EXERCIȚIUL Scrieți un program numit myecho care își imprimă argumentele liniei de comandă și variabilele de rulare De exemplu: unix> /myecho argl arg Argumente ale liniei de comandă: argv[ ]: myecho argv[l]: argl argv[ ]: arg Variabile de mediu de execuție: envp[ ] : PWD=/usrO/droh/ics/code/ecf epvar[ ] : TERM=emacs epvar[ ]: USER=droh epvar[ ]: SHELL=/usr/local/bin/tcsh epvar[ ]: HOME=/usrO/droh Utilizarea funcțiilor pentru a lansa programe Programe precum shell-urile Unix și serverele Web (vezi Capitolul ) folosesc intens funcțiile fork și exce Procesorul de comenzi este un program de dialog de aplicație care lansează alte programe în detrimentul instrucțiunilor utilizatorului Primul shell a fost programul sh, urmat de variante precum csh, tcsh, ksh și bash Procesorul de comenzi efectuează o serie de pași de citire/procesare și apoi iese În pasul de citire, este introdusă linia de comandă a utilizatorului La pasul de procesare, linia de comandă este analizată și programele sunt executate în numele utilizatorului Lista arată subrutina principală a unui shell simplu Procesorul de comandă emite un prompt de linie de comandă, așteaptă ca utilizatorul să introducă linia de comandă prin stdin și apoi procesează acea linie de comandă [ Lista Subrutina principală a celui mai simplu procesor de comandă #include „csapp h” #define MAXARGS /* prototipuri de funcții */ void eval(char *cmdline); int parseline(char *buf, char **argv); int builtin command(char **argv); opt Partea a II-a Executarea programelor în sistem int main() { caractere cmdline[MAXLINE]; /* linie de comandă ♦/ în timp ce ( ) { /* citeste */ printf(">"); Fgets(cmdline, MAXLINE, stdin); dacă (feof(stdin)) ieșire( ); nouăsprezece /* procesare */ eval(cmdline); } } Lista - arată codul care gestionează linia de comandă Prima sa sarcină este să apeleze funcția parseline (Listarea ), care analizează argumentele liniei de comandă separate prin spațiu și produce vectorul argv care va fi transmis în cele din urmă către exec Se așteaptă ca primul argument să fie fie numele unei comenzi shell încorporate care va fi interpretată direct, fie numele unui fișier obiect executabil care va fi încărcat și rulat pe cont în contextul unui nou proces copil /* eval - procesează linia de comandă */ void eval(char *cmdline) { caractere *argv[MAXARGS]; /* argv pentru exec() */ charbuf[MAXLINE]; /* stochează linia de comandă modificată */ int bg; /* treaba trebuie făcută în bg sau fg? */ pid t pid; /* ID proces */ opt strcpy(buf, cmdline); bg = parseline(buf, argv); dacă (argv[ ] = NULL) întoarcere; /* ignora liniile goale */ if (!builtin command(argv)) { if ((pid = Fork()) = ) { /★ proces copil se execută sarcină personalizată ♦/ dacă (exexe(argv[ ], argv, environ) + (apăsați simultan tastele) de la tastatură în timp ce un proces se execută în prim-plan, nucleul trimite un SIGINT (semnal ) procesului din prim-plan Un proces poate forța un alt proces să se termine trimițându-i un semnal SIGKILL (semnal ) Semnalele și nu pot fi interceptate sau ignorate Ori de câte ori un proces copil se termină sau se oprește, nucleul trimite un semnal SIGCHLD (semnal ) către procesul părinte Terminologie legată de semnale Procesul de semnalizare către destinație are loc în doi pași: □ Trimiterea unui semnal Nucleul trimite (trimite) un semnal către procesul de destinație prin ajustarea unei stări în contextul procesului de destinație Un semnal poate fi trimis din unul din două motive: • nucleul a detectat un eveniment în sistem, cum ar fi o eroare de împărțire la zero sau terminarea unui proces copil; • Procesul numit funcția kill (vezi Secțiunea ) pentru a solicita explicit nucleului să trimită un semnal către procesul de destinație Un proces poate trimite, de asemenea, un semnal pe cont propriu □ Primirea unui semnal Procesul de destinație primește un semnal în momentul în care este solicitat de nucleu să răspundă într-un fel la trimiterea semnalului Procesul poate fie ignora semnalul, fie poate termina sau intercepta semnalul prin executarea unei funcții la nivel de utilizator numită handler de semnal Un semnal care a fost trimis, dar care nu a fost încă primit se numește semnal întârziat Poate exista cel mult un semnal întârziat de orice tip în orice moment Dacă un proces are un semnal de tip k în așteptare, atunci nu sunt puse în coadă niciun semnal de tip k ulterioare trimise procesului respectiv; doar se pierd Un proces poate bloca selectiv recepția anumitor semnale Dacă un semnal este blocat, acesta poate fi trimis, dar semnalul întârziat rezultat nu va fi primit până când procesul deblochează semnalul Semnalul întârziat poate fi recepționat cel mult o dată Pentru fiecare proces, nucleul menține un set de semnale în așteptare în vectorul de biți în așteptare și un set de semnale blocate în vectorul de biți blocați Nucleul setează bitul k în așteptare ori de câte ori este trimis un semnal de tip k și șterge bitul k în așteptare ori de câte ori este primit un semnal de tip k Partea a II-a Executarea programelor în sistem Trimiterea semnalelor Sistemele Unix au mai multe mecanisme de trimitere a semnalelor către procese Toate aceste mecanisme se bazează pe conceptul de grup de procese Grupuri de procese Fiecare proces aparține exact unui grup de procese, care este identificat printr-un ID de grup de procese întreg pozitiv Funcția getpgrp returnează ID-ul grupului de procese pentru procesul curent #include pid t getpgrp(void); În mod implicit, un proces copil aparține aceluiași grup de procese ca și procesul părinte Folosind funcția setpgid, un proces își poate schimba propriul grup de procese sau grupul de procese al altui proces: #include pid t setpgid(pid t pid, pid t pgid); Funcția setpgid returnează la succes, - la eroare și schimbă grupul de procese al procesului pid în pgid Dacă pid este zero, atunci este utilizat PID-ul procesului curent Dacă pgid este zero, atunci PID-ul procesului dat de pid este utilizat pentru ID-ul grupului de procese De exemplu, dacă procesul este procesul apelant, atunci setpgid( , ); creează un nou grup de procese pentru care ID-ul grupului de procese este și adaugă procesul la acest nou grup Programul /bin/kiii trimite un semnal arbitrar unui alt proces De exemplu, comanda unix > kill - trimite un semnal (SIGKILL) procesului O valoare PID negativă face ca un semnal să fie trimis către fiecare proces din grupul de procese PI De exemplu, comanda unix > kill - - trimite un semnal SIGKILL fiecărui proces din grupul de procese Trimiterea semnalelor de la tastatură Shell-urile Unix folosesc abstractizarea jobului pentru a reprezenta procesele care sunt generate ca urmare a procesării unei singure linii de comandă În orice moment, există cel mult un job în prim-plan și, eventual, mai multe joburi în fundal Capitolul Gestionarea excepțiilor De exemplu, introducerea unix> Îs sortez creează un job în prim-plan format din două procese conectate printr-o conductă Unix, unul rulând programul is, celălalt rulând programul de sortare Procesorul de comenzi pentru fiecare job formează un grup separat de procese De obicei, ID-ul grupului de procese este preluat din procesul părinte din acest job De exemplu, în fig Figura prezintă un procesor de comenzi cu un job în prim-plan și două joburi în fundal PID-ul procesului părinte din jobul din prim-plan este , iar ID-ul grupului de procese este Procesul părinte a generat două procese copil, fiecare dintre ele fiind, de asemenea, membru al grupului de procese cu ID-ul egal cu Grupul de proces prioritar Orez Grupuri de procese în prim-plan și în fundal Introducerea + de la tastatură face ca semnalul SIGINT să fie trimis către shell Shell-ul interceptează acest semnal (vezi secțiunea ) și apoi trimite un SIGINT fiecărui proces din grupul de procese din prim-plan Acțiunea standard implicită este de a încheia sarcina din prim-plan În mod similar, tastând + trimite un semnal SIGTSTP către shell, pe care îl interceptează și trimite un semnal SIGTSTP fiecărui proces din grupul de procese din prim-plan Acțiunea standard implicită este oprirea (suspendarea) jobului din prim-plan Trimiterea semnalelor folosind funcții Procesele trimit semnale altor procese (inclusiv ele însele) apelând funcția kii: Partea a II-a Executarea programelor în sistem #include #include int kill(pid t pid, int sig); Funcția returnează dacă totul este ok, - dacă există o eroare Dacă pid este mai mare decât zero, atunci funcția kill trimite numărul semnalului sig către pid Dacă pid este mai mic decât zero, atunci kill trimite un semnal sig fiecărui proces din grupul de procese abs(pid) Lista - este un exemplu de proces părinte care utilizează funcția kill pentru a trimite un semnal SIGKILL procesului său copil #include „csapp h” int main() { pid t pid; /* Procesul copil inactivează până la recepționarea semnalului SIGKILL moare apoi */ dacă ((pid « ForkO) == ) { Pauză(); /* așteptați un semnal */ printf("controlul nu ar trebui să ajungă niciodată aici!\n"); ieșire( ); } /* procesul părinte trimite un semnal SIGKILL procesului copil */ Kill(pid, SIGKILL); ieșire( ); } Un proces își poate trimite semnale SIGALRM prin apelarea funcției de alarmă #include unsigned int alarm(unsigned int secs); Funcția de alarmă face ca nucleul să trimită un semnal SIGALRM către procesul de apelare la fiecare secundă de secunde Dacă sec este zero, atunci nu este programată nicio alarmă nouă În ambele cazuri, apelul la alarmă anulează toate alarmele în așteptare și returnează numărul de secunde rămase înainte ca orice alarmă în așteptare să fi fost trimisă (dacă acel apel de alarmă nu o anulează), sau dacă astfel de alarme în așteptare nu a existat nicio anxietate Lista - arată un program numit alarmă care provoacă o întrerupere SIGALRM la fiecare secundă timp de cinci secunde Când se trimite al șaselea SIGALRM, acesta se termină În timpul execuției programului, fiecare Capitolul : Gestionarea excepțiilor kundu timp de cinci secunde, se va auzi un bip: „ventilator”, după care semnalul „woom! ” și programul se va încheia: unix> /alarma VENTILATOR VENTILATOR BOOM! unu cinci opt nouă unsprezece #include „csapp h” void handler (int sig) static int beeps - ; printf("BEEP\n"); dacă (++bipuri typedef void handler t(int); handler t *signal(int signum, handler t *handler); Funcția de semnal returnează un pointer către handlerul anterior dacă totul este OK și SIG ERR dacă există o eroare (nu setează eggpo) Ea poate schimba acțiunea asociată cu utilizarea semnalului signum într-unul din trei moduri: □ Dacă handlerul conține SIG JGN, atunci semnalele signum sunt omise □ Dacă handlerul conține SIG DFL, atunci acțiunile pentru semnale de tip signum vor fi din nou acțiunile standard implicite □ În caz contrar, handler este adresa unei funcții definite de utilizator, numită handler de semnal, care va fi apelată ori de câte ori procesul primește un semnal de tip signum Modificarea acțiunii implicite prin transmiterea acestei adrese de handler la funcția de semnal se numește setarea handler-ului Apelarea unui handler se numește captarea semnalului Execuția unui handler se numește manipulare a semnalului Când un proces captează un semnal de tip k, handlerul configurat pentru semnalul k este invocat folosind un singur argument întreg, valoarea Capitolul Gestionarea excepțiilor care este egal cu k Acest argument permite aceleiași funcții de gestionare să intercepteze diferite tipuri de semnale Când un handler execută o instrucțiune return, controlul este (de obicei) transferat înapoi la instrucțiunea din fluxul de control la care procesul a fost întrerupt de semnal Spunem „de obicei”, deoarece, pe unele sisteme, un apel de sistem întrerupt returnează imediat o eroare Lista - arată un program care interceptează semnalul SIGINT trimis de shell ori de câte ori utilizatorul tasta + pe tastatură Acțiunea standard pentru SIGINT este de a încheia imediat procesul În acest exemplu, schimbăm comportamentul implicit pentru a capta semnalul, a tipări un mesaj și apoi a încheia procesul ^Listing : Programul de captură^condus pe UIMT/ j #include „csapp h” void handler(int sig) /* SIGINT handler */ { printf("Prin SIGINTXn"); ieșire( ); } int main() { /* instalează handler SIGINT */ dacă (semnal(SIGINT, handler) = SIG ERR) unix error(„eroare de semnal”); paisprezece pauză(); /* așteptați un semnal */ ieșire (Ob- le} Funcția handler este definită pe liniile - Subrutina principală de pe liniile - instalează handlerul, după care procesul intră în somn până când semnalul este primit (linia ) După recepționarea semnalului SIGINT, handlerul este executat, este tipărit un mesaj (linia ), după care procesul se încheie (linia ) EXERCIȚIUL Scrieți un program numit snooze care preia un singur argument din linia de comandă, apelează funcția snooze de la ex cu acest argument și apoi iese Scrieți acest program astfel încât utilizatorul să poată întrerupe funcția de amânare tastând + pe tastatură Partea a II-a Executarea programelor în sistem De exemplu: unix> /snooze A dormit din secunde Utilizatorul apasă + după secunde unix> Unele probleme de procesare a semnalului Pentru programele care captează un singur semnal, procesarea semnalului este simplă și se termină cu terminarea acestora Cu toate acestea, dacă programul interceptează mai multe semnale, există unele probleme □ Semnalele întârziate sunt blocate De obicei, manipulatorii de semnal pe Unix blochează semnalele întârziate de tipul gestionat în prezent de handler-ul dat De exemplu, să presupunem că un proces a captat semnalul SIGINT și handlerul său SIGINT se execută în prezent Dacă un alt semnal SIGINT este trimis procesului, acel SIGINT va deveni în așteptare și nu va fi acceptat până când acel handler va reveni □ Semnalele întârziate nu sunt puse în coadă Este permis să existe cel mult un semnal întârziat de orice tip Astfel, dacă două semnale de tip k sunt trimise către aceeași destinație în timp ce semnalul către este blocat deoarece acel proces de destinație execută în prezent un handler pentru semnalul A, atunci al doilea semnal este pur și simplu pierdut; nu este la coadă Ideea cheie este că existența unui semnal întârziat indică doar că cel puțin un astfel de semnal a sosit □ Apelurile de sistem pot fi întrerupte Apelurile de sistem, cum ar fi citirea, așteptarea și acceptarea, care pot bloca un proces pentru o perioadă lungă de timp, sunt numite apeluri de sistem lente Pe unele sisteme, apelurile lente de sistem care sunt întrerupte atunci când un handler de semnal captează un semnal nu sunt recuperate atunci când controlul revine de la manipulatorul de semnal, ci în schimb controlul este returnat direct utilizatorului cu o condiție de eroare, iar egpo este setat la EINTR Să aruncăm o privire mai atentă la subtilitățile procesării semnalului folosind o aplicație simplă care este în esență aceeași cu programele reale, cum ar fi shell-urile și serverele Web Esența problemei este că procesul părinte generează mai multe procese copil, care sunt executate independent de ceva timp, după care se încheie Procesul părinte trebuie să omoare procesele copil pentru a nu lăsa zombi în sistem Dar dorim, de asemenea, ca procesul părinte să poată face alte lucrări în timp ce procesele secundare rulează Prin urmare, am luat decizia de a încheia procesele copil folosind handler-ul S GCHLD în loc să așteptăm în mod explicit ca procesele copil să se termine Amintiți-vă că nucleul trimite un semnal SIGCHLD unui proces părinte ori de câte ori unul dintre procesele sale secundare iese sau se oprește Capitolul Gestionarea excepțiilor Lista reprezintă prima noastră încercare Procesul părinte stabilește un handler SIGCHLD și apoi generează trei procese copil, fiecare rulând timp de o secundă și apoi ieșind Între timp, procesul părinte așteaptă o linie de intrare de la terminal și apoi o procesează Această prelucrare este organizată folosind o buclă infinită Când fiecare proces copil se termină, nucleul notifică procesul părinte trimițându-i un semnal SIGCHLD Procesul părinte prinde SIGCHLD, termină unul dintre procesele fiu, efectuează o lucrare suplimentară de curățare reprezentată de instrucțiunea sleep( ) și apoi revine Programul de semnal pare surprinzător de simplu la prima vedere Dar dacă îl rulăm pe un cont pe un sistem Linux, obținem următoarea ieșire: linux > /signall salut de la copilul salut de la copilul salut de la copilul Handler a secerat copilul Handler a secerat copil intrare de procesare părinte #include „csapp h” void handlerl (int sig) { pid t pid; dacă ((pid = waitpid(-l, NULI", )} + Linux suspendat > ps PID TTY STAT TIME COMMAND p T : semnal p Z : (semnal ) p R : ps Care este motivul contului eșuat? Problema este că acest program nu ține cont de faptul că semnalele pot fi blocate și că semnalele nu sunt puse în coadă Asta sa întâmplat aici Primul semnal este primit și interceptat de procesul părinte În timp ce handlerul este încă ocupat cu procesarea primului semnal, al doilea semnal sosește și este adăugat la setul de semnale în așteptare Cu toate acestea, deoarece semnalele de tip SIGCHLD sunt blocate de handler-ul SIGCHLD, al doilea semnal nu va fi primit La scurt timp după aceea, în timp ce operatorul este încă ocupat cu procesarea primului semnal, sosește al treilea semnal Deoarece există deja SIGCHLD întârziat, acest al treilea SIGCHLD va fi pierdut Mai târziu, la un moment dat, Capitolul Gestionarea excepțiilor după ce handlerul revine, nucleul detectează că există un semnal SIGCHLD în așteptare și determină procesul părinte să primească semnalul Procesul părinte interceptează semnalul și rulează handlerul a doua oară După ce handlerul termină procesarea celui de-al doilea semnal, nu mai sunt semnale SIGCHLD în așteptare și nu vor mai fi, deoarece toate cunoștințele despre al treilea SIGCHLD s-au pierdut Din toate acestea, putem concluziona că mesajele nu pot fi folosite pentru a număra apariția evenimentelor în alte procese Pentru a remedia această problemă, rețineți că prezența unui semnal în așteptare înseamnă doar că cel puțin un semnal a sosit de la ultima dată când procesul a primit un semnal de acest tip Prin urmare, este necesar să modificați handlerul SIGCHLD pentru a ucide cât mai multe procese copil zombi cu fiecare apel Lista arată handlerul SIGCHLD modificat t ;••••: include „csapp h” void handler (int sig) { pid t pid; while((pid = waitpid(-l, NULL, )) > ) printf("Handler a recoltat copilul %d\n", (int)pid); dacă (errno != ECHILD) unix error("eroare waitpid"); Somn ( ); întoarcere; } paisprezece int main() { int i, n; charbuf[MAXBUF]; nouăsprezece dacă (semnal(SIGCHLD, handler ) == SIG ERR) unix error(„eroare de semnal”); /* procesul părinte generează procesul copil */ pentru (i = ; i /signa! salut de la copil salut de la copil salut de la copilul Handler a secerat copilul Handler a secerat copilul Handler a secerat copilul intrare de procesare părinte Cu toate acestea, încă nu am făcut toată munca Dacă rulăm programul signal pe contul de pe un sistem Solaris, acesta ucide corect toate procesele copil zombie Cu toate acestea, acum apelul de sistem de citire blocat revine prematur cu o eroare, înainte de a putea introduce ceva de la tastatură: solaris> /signal salut de la copil salut de la copil salut de la copil Handler a secerat copilul Handler a secerat copilul Handler a secerat copilul citeste: Sistem intrerupt caii Care este motivul contului eșuat? Problema aici este că, pe un sistem precum Solaris, apelurile lente de sistem, cum ar fi read, nu reiau automat execuția după ce sunt întrerupte de un semnal primit În schimb, acestea sunt returnate prematur la aplicația de apelare cu Capitolul : Gestionarea excepțiilor stare de eroare, spre deosebire de sistemele Linux, care reiau automat execuția apelurilor de sistem întrerupte Pentru a scrie cod portabil de manipulare a semnalului, este necesar să se țină cont de posibilitatea unei reveniri premature de la un apel de sistem și să se reia execuția programatic dacă se întâmplă acest lucru Lista - arată o modificare a programului de semnal care reia programatic execuția unui apel de citire întrerupt Codul de returnare EINTR din eggpo indică faptul că apelul de sistem de citire a revenit prematur după ce a fost întrerupt #include „csapp h” void handler (int sig) { pid t pid; while((pid = waitpid(-l, NULL, )) > ) printf("Handler a recoltat copilul %d\n", (int)pid); dacă (errno != ECHILD) unix error("eroare waitpid"}; Somn ( ); întoarcere; } paisprezece int main() { int i, n; charbuf[MAXBUF]; pid t pid; nouăsprezece dacă (semnal(SIGCHLD, handler ) == SIG ERR) unix error(„eroare de semnal”); treizeci /* procesul părinte generează procesul copil ♦/ pentru (i = ; i /signal salut de la copil salut de la copil salut de la copil Handler a secerat copilul intrare de procesare părinte Procesare portabilă a semnalului Diferite sisteme implementează semantica de procesare a semnalului în moduri diferite De exemplu, comportamentul unui apel sistem lent întrerupt – indiferent dacă este reluat sau avortat – este partea neplăcută a gestionării semnalului Unix Pentru a depăși această problemă, a fost dezvoltat standardul POSIX, care definește funcția de sigaction, care permite utilizatorilor de pe sisteme compatibile cu POSIX, cum ar fi Linux și Solaris, să definească clar semantica de gestionare a semnalului pe care doresc să o urmeze în proiectele lor #include int sigaction(int signum, struct sigaction *act, struct sigaction *oldact); Funcția sigaction returnează dacă totul este în regulă, - dacă există o eroare și este destul de greoaie deoarece solicită utilizatorului să seteze membrii structurii O abordare mai clară, propusă pentru prima dată de Stevens [ ], este definirea unei funcții de înveliș numită semnal care apelează sigaction Lista - arată definiția funcției Signal, care Capitolul Gestionarea excepțiilor care se numește exact în același mod ca și funcția semnal Funcția de ambalare a semnalului setează un handler de semnal cu următoarea semantică de gestionare a semnalului: □ Sunt blocate numai semnalele de tipul manipulat curent de către operator □ Semnalele nu sunt puse în coadă în nicio implementare □ Apelurile de sistem întrerupte își reiau automat execuția cât mai curând posibil □ Odată ce un handler de semnal a fost setat, acesta rămâne setat până când semnalul este apelat cu un argument handler, fie SIG IGN, fie SIG DFL Unele sisteme Unix mai vechi restabilește efectul unui semnal la valoarea sa implicită după ce semnalul a fost procesat de către handler handler t *Signal(int signum, handler t *handler) { struct sigaction action, old action; action sa handler = handler; sigemptyset(&action sa mask); /♦ blochează semnalele procesate tip */ action sa flags = SA RESTART; /* reia execuția sistemului sunați dacă este posibil */ opt dacă (sigaction(signum, &action, &old action) ) printf("Handler a recoltat copilul %d\n", (int)pid); dacă (errno !a ECHILD) unix error("eroare waitpid"); Somn ( ); întoarcere; } paisprezece int main() { int i, n; charbuf [MAXBUFJ; pid t pid; douăzeci Semnal (SIGCHLD, handler ); /* Funcția de înveliș pentru gestionarea erorilor sigație ★/ /★ procesul părinte generează procesul copil */ pentru (i = ; i int sigprocmask(int how, const sigset t *set, sigset t *oldset); int sigemptyset(sigset t *set); Capitolul Gestionarea excepțiilor int sigfillset(sigset t *set); int sigaddset(sigset t *set, int signum); int sigdelset(sigset t *set, int signum); Returnează: dacă totul este ok, - dacă există o eroare int sigismember(const sigset t *set, int signum); Funcția sigprocmask returnează dacă este membru al mulțimii, dacă nu aparține mulțimii și - în caz de eroare Schimbă setul de semnale blocate în prezent (vectorul de biți biocked este descris în Secțiunea ) Comportamentul specific depinde de valoarea modului în care: □ S G BLOCK adaugă semnale în set la biocked (biocked -biocked I set) □ SIG-UNBLOCK elimină semnalele din set din biocked (biocked -biocked & -set) □ SIG SETMASK este biocked = setat Dacă oldset nu este NULL, atunci valoarea anterioară a vectorului de biți biocked este stocată în oldset Seturile de semnale, cum ar fi setările, pot fi controlate utilizând următoarele funcții □ Funcția sigemptyset inițializează setul, ștergând setul □ Funcția sigfillset adaugă fiecare semnal la setat □ Funcția sigaddset adaugă signum la set, sigdelset elimină signum din set □ Funcția sigismember returnează dacă signum este un membru set și dacă nu este □ Funcția sigprocmask este utilă pentru sincronizarea proceselor părinte și copil De exemplu, luați în considerare Lista - , care arată structura de bază a unui shell Unix tipic Procesul părinte păstrează o evidență a proceselor sale secundare într-o listă de locuri de muncă Când un proces părinte generează un nou proces copil, acesta adaugă acel proces copil la lista de joburi Când un proces părinte oprește un proces copil terminat (zombie) într-un handler SIGCHLD, acesta elimină acel proces copil din lista de joburi manipulator de goluri (int sig) { pid t pid; while ((pid - waitpid(- , NULL, )) > ) /* elimina copilul proces zombi */ deletejob(pid); /* eliminați procesul copil din lista de locuri de muncă ♦/ dacă (errno!= ECHILD) unix error("eroare waitpid"); opt } nouă Partea a II-a Executarea programelor în sistem int main(int argc, char **argv) unsprezece { int pid; sigset tmask; paisprezece Semnal (SIGCHLD, handler); initjobsO; /* inițializați lista de joburi */ în timp ce( ) { Sigemptyset(&mask); Sigaddset(&mask, SIGCHLD); Sigprocmask(SIG BLOCK, &mask, NULL); /* blochează SIGCHLD */ /* proces copil */ if((pid = Fork()) « ) { Sigprocmask(SIG UNBLOCK, &mask, NULL); /* deblochează SIGCHLD */ Execs(' bin/ls", argv, NULL); } /* proces părinte */ addjob(pid); /* adaugă procesul copil la lista de locuri de muncă */ Sigprocmask(SIG UNBLOCK, &mask, NULL); /* deblochează SIGCHLD */ } ieșire( ); } În acest exemplu, procesul părinte asigură că adăugarea jobului este făcută înainte ca funcția de ștergere corespunzătoare să fie apelată Dacă nu sincronizăm procesele părinte și copil într-un fel sau altul, atunci această secvență de evenimente este posibilă □ Procesul părinte inițiază funcția fork, nucleul selectează un proces copil nou generat și îl pornește pentru execuție în locul procesului părinte □ Înainte ca procesul părinte să poată rula din nou, procesul copil se încheie și devine un zombie, determinând nucleul să trimită un semnal SIGCHLD către procesul părinte □ Mai târziu, când procesul părinte devine din nou executabil, dar înainte ca acesta să fi început, nucleul detectează un semnal SIGCHLD în așteptare, iar acest lucru face ca acesta să fie recepționat de handler-ul care se execută în procesul părinte □ Handler-ul elimină procesul copil terminat, încearcă să șteargă sarcina, dar nu se întâmplă nimic, deoarece procesul părinte nu a adăugat încă acest proces copil în listă Capitolul Gestionarea excepțiilor □ După ce handlerul se completează, nucleul generează procesul părinte returnat de la fork și adaugă procesul copil inexistent la lista de joburi apelând addjob Faptul este că, dacă nu facem nimic în mod specific, atunci este posibilă o situație când deletejob va fi apelat înainte de addjob Lista arată o modalitate de a remedia această problemă Blocarea semnalului SIGCHLD înainte de a apela fork și deblocarea acestuia numai după apelarea addjob asigură că procesul copil poate fi oprit numai după ce a fost adăugat la lista de joburi Rețineți că procesele copil moștenesc setul biocked al părintelui, așa că trebuie să aveți grijă când deblocați semnalul SIGCHLD într-un proces copil înainte de a apela exec Transferuri non-locale de control Limbajul C oferă utilizatorilor o formă de transfer de excepții numită un salt non-local, care transferă controlul direct de la o funcție la alta care se execută în prezent, fără a fi nevoie să treacă prin secvența obișnuită de „apel și întoarcere” Salturile non-locale sunt implementate de funcțiile setate jmp și longjmp #include int setjmp(jmp buf env); int sigsetjmp(sigjmp buf env, int savesigs); Funcția set jmp returnează de la setjmp, o valoare diferită de zero de la longjmp, stochează contextul stivei curente în buffer-ul epv pentru utilizare ulterioară în longjmp #include void longjmp(jmp buf env, int retval); void siglongjmp(sigjmp buf env, int retval); Funcția longjmp restabilește contextul stivei din buffer-ul env și apoi provoacă o întoarcere de la cel mai recent apel jmp setat care a inițializat env După aceea, set jmp returnează o valoare retval diferită de zero La început, interacțiunile dintre setjmp și longjmp pot părea confuze și de neînțeles set jmp este apelat o dată, dar revine de mai multe ori: o dată când setjmp este apelat pentru prima dată și contextul stivei este stocat în buffer-ul eV și o dată pentru fiecare apel la longjmp În același timp, funcția longjmp este apelată o dată, dar nu se întoarce niciodată O valoare de aplicație importantă a salturilor non-locale este aceea că permit revenirea imediată de la apelurile de funcții imbricate profund, de obicei după ce se confruntă cu o condiție de eroare Dacă o condiție de eroare este găsită într-un apel de funcție profund imbricat, puteți utiliza un non-false Partea a II-a Executarea programelor în sistem cal jump pentru a reveni direct la gestionarea erorilor publice în loc de derularea plictisitoare a stivei de apeluri Lista arată un exemplu despre cum se poate face acest lucru Subrutina principală apelează mai întâi jmp pentru a salva contextul actual al stivei, apoi apelează funcția foo, care la rândul său apelează funcția bar Dacă apare o eroare în foo sau bar, acestea revin direct de la set jmp printr-un apel către longjmp Valoarea returnată diferită de zero de la setjmp indică tipul de eroare, care poate fi apoi decodificată și tratată într-un singur loc în codul programului #include „csapp h” jmp buf buf; int eroarel = ; int eroare = ; void foo(void)f bar(void); nouă int main() unsprezece { int rc; rc = setjmp(buf); dacă (rc " ) foo(); altfel dacă (rc = ) printf("S-a detectat o condiție de eroare în foo\n"); altfel dacă (rc - ) printf("S-a detectat o condiție de eroare în foo\n"); altceva printf(„Stare de eroare necunoscută în foo\n”); ieșire( ); } /* funcția profund imbricată foo */ void foo (void) { dacă (eroare) longjmp(buf, ); bar(); } Capitolul Gestionarea excepțiilor void bar(void) { dacă (eroare ) longjmp(buf, ); } Acest exemplu arată o structură care utilizează salturi non-locale pentru a reveni dintr-o condiție de eroare într-o funcție profund imbricată - fără a derula întregul stivă O altă aplicație importantă a salturilor non-locale este de a provoca un salt de la un handler de semnal la o anumită adresă de memorie dintr-un program, în loc să se întoarcă la instrucțiunea în care semnalul a fost întrerupt Lista arată un program simplu care ilustrează acest truc standard Programul folosește semnale și salturi non-locale pentru a permite o repornire ușoară ori de câte ori utilizatorul tasta + pe tastatură Funcțiile sigsetjmp și siglongjmp sunt versiuni ale setjmp și longjmp care pot fi utilizate de către manipulatorii de semnal #include „csapp h” sigjmp buf buf; void handler (int sig) { siglongjmp(buf, ); opt } nouă int main() unsprezece { Semnal(SIGINT, handler); dacă (!sigsetjmp(buf, )) printf("pornind\n")t altfel printf("repornindXn optsprezece în timp ce(l) { Somn( ); printf("se proceseaza } ieșire( ); } Partea a II-a Executarea programelor în sistem Primul apel la sigsetjmp salvează stiva și contextul semnalului atunci când programul pornește pentru prima dată Programul principal intră apoi într-o buclă de procesare fără sfârșit Dacă utilizatorul tasta + , shell-ul va trimite procesului un semnal SIGINT, pe care îl va intercepta În loc să se întoarcă de la manipulatorul de semnal, care ar transfera controlul înapoi în bucla de procesare întreruptă, handlerul de semnal face un salt non-local înapoi la începutul programului principal Dacă rulăm acest program pe sistemul nostru, vom obține următoarea ieșire: unix> /repornire începe procesarea procesare repornire procesare repornire procesare utilizator a apăsat + -C utilizator a apăsat + -C Excepții programatice în C++ și Java Mecanismele de excepție furnizate de C++ și Java sunt versiuni de nivel înalt, mai structurate ale funcțiilor setjmp și longjmp ale lui C Vă puteți gândi la o clauză catch în interiorul unei clauze try ca ceva asemănător cu funcția setjmp În mod similar, instrucțiunea throw are o oarecare asemănare cu funcția longjmp Organizarea managementului proceselor Sistemele Unix oferă mai multe instrumente convenabile pentru monitorizarea și controlul proceselor: □ strace tipărește o urmă a fiecărui apel de sistem efectuat de program și procesele sale secundare Un instrument distractiv pentru studenții curioși Compilați programul cu opțiunea -static pentru a obține o urmărire mai curată, fără rezultatul greoi asociat bibliotecilor partajate; □ ps înregistrează procesele (inclusiv zombi) aflate în prezent în sistem; □ sus afișează informații despre utilizarea resurselor de către procesele curente; □ uciderea trimite un semnal unui proces Convenabil pentru depanarea programelor cu handler de semnal și curăță procesele imprevizibile; □ /pros (Linux și Solaris) este un sistem de fișiere virtual care imprimă conținutul numeroaselor structuri de date kernel în text ASCII și poate fi citit de programele utilizatorului De exemplu, tastați „cat /proc/loadavg” pentru a vedea media curentă a încărcării pe sistemul dumneavoastră Linux Capitolul , Gestionarea excepțiilor rezumat Controlul transferului prin excepție poate avea loc la toate nivelurile sistemului informatic La nivel hardware, excepțiile sunt tranziții neașteptate în fluxul de control care sunt cauzate de evenimente din procesor Fluxul de control este transmis operatorului de program, care efectuează unele procesări și apoi readuce controlul fluxului de control întrerupt În total, există patru tipuri diferite de excepții: întreruperi hardware, erori, întreruperi și întreruperi de sistem Întreruperile hardware apar asincron (cu privire la toate instrucțiunile) dacă un dispozitiv I/O extern, cum ar fi un cip de cronometru sau un controler de disc, trimite un semnal de întrerupere la o ieșire de pe cipul procesorului Controlul revine la instrucțiune în urma instrucțiunii care a cauzat eroarea Erorile și blocările apar sincron ca urmare a execuției comenzii Operatorii de gestionare a erorilor reiau execuția instrucțiunii care a cauzat eroarea în momentul întreruperii, în timp ce gestionanții nu returnează niciodată controlul firului de execuție întrerupt În cele din urmă, capcanele sunt similare cu apelurile de funcție care sunt utilizate pentru a implementa apeluri de sistem care oferă aplicațiilor puncte de intrare controlate în codul sistemului de operare La nivelul sistemului de operare, nucleul oferă o implementare a conceptului fundamental al unui proces Procesul oferă aplicațiilor două abstracții importante: □ fluxuri logice de control care dau fiecărui program iluzia că are utilizarea exclusivă a procesorului; □ spații de adrese închise, oferind iluzia că fiecare program are utilizarea exclusivă a memoriei RAM Într-un mediu de interfață de sistem de operare, aplicațiile pot genera procese secundare, pot aștepta ca procesele copil să se oprească sau să se termine, să lanseze noi programe pe cheltuială și să intercepteze semnale de la alte procese Semantica procesării semnalului este o chestiune destul de subtilă și se poate schimba de la un sistem la altul Cu toate acestea, există mecanisme pe sistemele compatibile cu Posix care permit programelor să definească în mod clar semantica așteptată a procesării semnalului În cele din urmă, la nivel de aplicație, programele C pot folosi salturi non-locale pentru a ocoli mecanismul normal al stivei de apeluri și pentru a transfera controlul direct de la o funcție la alta Note bibliografice Specificația de macroarhitectură Intel conține o descriere detaliată a excepțiilor și întreruperilor din procesoarele Intel [ ] Textele sistemului de operare [ , , ] conțin informații suplimentare despre excepții, procese și semnale Lucrarea clasică a lui Stevens [ ], deși oarecum depășită, rămâne un ghid valoros și foarte detaliat pentru lucrul cu procese și semnale din programele de aplicație Partea a II-a Executarea programelor în sistem Sarcini pentru soluție acasă PREOCUPARE ♦ În acest capitol, am introdus câteva funcții cu un comportament neobișnuit de apel și returnare: set jmp, longjmp, exec și fork Asociați fiecare dintre aceste funcții cu unul dintre comportamentele sale corespunzătoare: □ apelat o dată, revine de două ori; □ apelat o dată, dar nu se întoarce niciodată; □ apelat o dată, returnează controlul o dată sau de mai multe ori U E ”& E - L Dați una dintre posibilele rezultate ale următorului program: #include „csapp h” int main() { int x = ; dacă (Fork()!= ) printf("x=%d\n", ++x); nouă printf("x=%d\n", -x); ieșire( ); } OFF - ♦ De câte ori va imprima acest program șirul „hello”? #include „csapp h” void trebuie () { dacă (Fork() == ) { Furca(); printf("bună ziua\n"); ieșire( ); nouă } întoarcere; unsprezece } int main() paisprezece { trebuie(); Capitolul : Gestionarea excepțiilor printf("bună ziua\n"); ieșire (O); optsprezece } EXERCIȚIUL l De câte ori va imprima acest program șirul ”helio”? #include „csapp h” void trebuie () { dacă (Fork() = " ) { Furca(); printf(”bună ziua\n”); întoarcere; nouă } întoarcere; unsprezece } int main() paisprezece { trebuie(); printf(”bună ziua\n”); ieșire( ); optsprezece } EXERCIȚIUL ♦ Care va fi rezultatul următorului program? #include „csapp h” int counter = ; int main() cinci { dacă (furcă () = ) { contor—; ieșire( ); nouă unsprezece paisprezece else { Așteptați (NULL); printf("contor = %d\n", ++contor); ieșire( ); cincisprezece } Partea a II-a Executarea programelor în sistem EXERCIȚIUL ♦ Listați toate ieșirile posibile ale programului în ex INFORMAȚII ♦ Luați în considerare următorul program: #include „csapp h” void end(void) { printf(" "); } int main() nouă { dacă (Fork() == ) atexit(end); dacă (Fork() == ) printf(" "); altfel printf(" "); ieșire( ); } Decideți care dintre următoarele concluzii poate avea loc Rețineți că funcția atexit preia un pointer de funcție și îl adaugă la lista de funcții (în poziția inițială, lista este goală) care va fi apelată atunci când funcția de ieșire este apelată ; ; ; ; EXERCIȚIUL ♦♦ Folosind execx, scrieți programul myls, al cărui comportament este identic cu cel al programului /bin/ls Programul dumneavoastră trebuie să accepte aceleași argumente de linie de comandă, să interpreteze aceleași variabile de rulare și să producă rezultate identice Programul is obține lățimea ecranului din variabila de mediu de rulare COLUMNS Dacă COLUMS nu este setat, atunci se presupune că ecranul are de coloane lățime Astfel, setând COLUMNS la o valoare mai mică de , puteți controla variabilele de rulare: Capitolul Gestionarea excepțiilor unix > setenv COLONNE unix> /myls ieșirea are o lățime de de poziții unix>unsetenv COLONNE unix> /myls acum ieșirea are o lățime de de poziții EXERCIȚIUL ♦♦♦ Modificați programul din Lista astfel încât să fie îndeplinite următoarele două condiții: Fiecare proces copil se termină anormal după ce a încercat să scrie la o adresă dintr-un segment procedural doar pentru citire Procesul părinte produce rezultate identice (cu excepția PID) cu următoarele: copil terminat cu semnalul : Eroare de segmentare copil terminat cu semnalul : Eroare de segmentare Sfat: citiți paginile de manual pentru secțiunile wait( ) și psignal( ) CERINȚE ♦♦♦ Scrieți propria versiune a funcției de sistem Unix: int sistemul meu(char ♦comandă); Funcția mysystem execută comanda făcând un apel la „/bin/sh -c command” și apoi revine imediat ce comanda este finalizată comandă De exemplu, dacă comanda este terminată prin apelarea exit( ), atunci sistemul returnează valoarea În caz contrar, dacă comanda se termină incorect, atunci mysystem returnează starea returnată de shell U PG-AZHN EN și E ♦ Unul dintre colegii tăi a venit cu ideea de a folosi semnale trimise procesului părinte pentru a număra evenimentele care au loc în procesul copil Ideea este de a notifica procesul părinte ori de câte ori are loc un eveniment, trimițându-i un semnal, astfel încât handlerul de semnal al părintelui să incrementeze variabila globală de contor, pe care procesul părinte o poate accesa ulterior când procesul copil iese Cu toate acestea, când rulează programul de testare din următoarea listă pe sistemul său, el constată că atunci când procesul părinte apelează printf, contorul este întotdeauna , chiar dacă procesul copil a trimis cinci semnale către procesul părinte Nedumerit, vine la tine pentru ajutor Poți explica care este greșeala lui? Partea a II-a Executarea programelor în sistem #include „csapp h” int counter = ; void handler (int sig) { counter++; somn( ); /* lasam handlerul sa lucreze */ întoarcere; YU} unsprezece int main() { int ig- IB Semnal(SIGUSR , handler); dacă (Fork() == ) { /★ proces copil */ pentru (i = ; i + ( + ) pe tastatură face ca shell-ul să trimită un semnal SIGINT (SIGTSTP) fiecărui proces din grupul de procese din prim-plan □ Comanda încorporată jobs înregistrează toate joburile de fundal □ Comanda încorporată bg reia execuția unui prin trimiterea semnalului SIGCONT către acel job, apoi rulând-o pe contul în fundal Argumentul poate fi fie PID, fie JID □ Funcția fg reia execuția unui prin trimiterea semnalului SIGCONT către acel job, apoi îl rulează pe cont cu prioritate □ Shell-ul omoara toate procesele copil zombie Dacă o lucrare iese deoarece primește un semnal care nu a fost prins, shell-ul imprimă un mesaj către terminal cu PID-ul lucrării și o descriere a acelui semnal Următoarea lista este un exemplu de jurnal de sesiune shell unix> /shell Rulați un program shell > fals fals: Comanda nu a fost găsită executabilul nu poate găsi modulul executabil > foo Lucrarea terminată prin semnal: Întreruperea tipurilor de utilizator + >foo & [ ] foo și >foo & [ ] foo și > locuri de munca [ ] Running foo & [ ] Running foo & > fg % Job [ ] oprit de semnal: Oprit Tipuri de utilizator + > locuri de munca [ ] Stoped foo & [ ] Running foo & > bg : Nu există un astfel de proces Partea a II-a Executarea programelor în sistem > bg [ ] foo și > /bin/kill Job terminat prin semnal: Terminat > fg % Se așteaptă finalizarea lucrării fg > renunta unix> Înapoi la shell-ul Unix Soluție de exercițiu SOLUȚIA EXERCITULUI În programul nostru exemplu din Listarea , procesul părinte și procesul copil execută seturi de instrucțiuni care nu se suprapun Cu toate acestea, în acest program, procesul părinte și procesul copil au segmente de cod de program identice Din punct de vedere conceptual, acest lucru poate fi dificil de înțeles, așa că încercați să înțelegeți soluția la această problemă Care va fi rezultatul procesului copil? Ideea cheie aici este că procesul copil execută ambele instrucțiuni printf După ce se întoarce fork, execută printf pe linia Apoi iese din instrucțiunea if și execută printf pe linia Iată rezultatul procesului copil: printf : x= printf : x= Care va fi rezultatul procesului părinte? Procesul părinte execută numai printf pe linia : printf : x= SOLUȚIE ȘI EXERCIȚII Acest program are același grafic de proces ca și programul din Lista Există patru procese în total, fiecare dintre ele scoate în evidență propriul șir „hello” Astfel, programul scoate patru linii „bună ziua” SOLUȚIA EXERCITULUI Acest program are același grafic de proces ca și programul din Lista Există patru procese în total, fiecare dintre ele imprimă propriul șir „hello” la doit și un șir „hello” la main după ce controlul revine de la doit Astfel, programul scoate un total de opt linii „bună ziua” SOLUȚIE^EXERCIȚIUL Ori de câte ori rulăm acest program pe cont, generează șase linii de ieșire Capitolul Gestionarea excepțiilor Ordinea liniilor de ieșire va varia de la sistem la sistem, în funcție de modul în care nucleul alternează comenzile între procesele părinte și cele secundare În general, este permisă orice permutare topologic neschimbată a vârfurilor următorului grafic: > ''O*' > '' '' > ''Bue'* proces părinte / ''Buna ziua'' \ —> '' '' —> Proces copil ''Vue'' De exemplu, dacă rulăm un program pe sistemul nostru, vom obține următoarea ieșire: unix> /waitprobl Buna ziua O unu Vue Vue În acest caz, procesul părinte se execută primul, scoțând „He ” pe linia și „ ” pe linia Apelul de așteptare se blochează deoarece copilul nu a ieșit încă, așa că nucleul face o schimbare de context și, de asemenea, transferă controlul către un proces copil care scoate „ ” pe linia și „Bue” pe linia , iar apoi iese cu o stare de ieșire de pe linia După ce copilul iese, execuția procesului părinte se reia Aceasta tipărește starea de ieșire a procesului copil pe linia și „Bue” pe linia EXERCIȚII DE SOLUȚIE unsigned int snooze(unsigned int secs) { unsigned int rc = sleep(secs); printf(”A dormit pentru %u din %u sec Xn”, secs - rc, sec); retur rc; cinci } EXERCIȚII DE SOLUȚIE ttinclude „csapp h” int main(int argc, char *argv[], char *envp[]) { int i; Partea a II-a Executarea programelor în sistem opt nouă unsprezece paisprezece printf (''Argumentul liniei de comandă: \n"); pentru (i= ; argv[i] != NULL; i++) printf(" argv[% d]: %s\n", i, argvf[i]; printf("X"); , printf("Variabile de mediu:\n"); pentru (i= ; envp[i] != NULL; i++) printf(" envp[% d]: %s\n", i, envp[i]); cincisprezece ieșire( ); } SOLUȚIE/ EXERCIȚIU Funcția de somn revine prematur ori de câte ori procesul de somn primește un semnal care nu poate fi ignorat Dar, deoarece acțiunea standard pentru SIGINT este de a termina procesul (vezi Tabelul ), ar trebui să instalați un handler SIGINT pentru a permite revenirea funcției de repaus Handler-ul pur și simplu prinde SIGNAL și readuce controlul la funcția de somn, care îl returnează imediat ttinclude „csapp h” /* SIGINT handler */ void handler (int sig) cinci { întoarcere; /* prinde semnalul și revine controlul */ } opt unsigned int snooze(unsigned int secs) { unsigned int re = sleep(secs); printf("A dormit pentru %u din %u sec Xn", sec - rc, sec); retur rc; } paisprezece int main(int argc, char **argv) { if (argc != ) { fprintf(stderr, „utilizare: %s \n”, argv[ ]); ieșire( ); douăzeci } if (signal(SIGINT, handler) == SIG ERR) /* set handler SEGMENT */ unix error("eroare de semnal\n"); (void)snooze(atoi(argv[l])); ieșire( ); } CAPITOLUL Măsurarea timpului de execuție a programului □ Trecerea timpului într-un sistem informatic □ Măsurarea timpului prin numărarea numărului de intervale □ Tejghele de bar □ Măsurarea timpului de execuție a programului folosind contoare de ceas □ Măsurarea ceasului în timp real □ Protocolul experimentului □ Privind spre viitor □ Implementarea schemei de măsurare K-best □ Sarcini bazate pe materialul acoperit □ Reluați Iată una dintre cele mai frecvente întrebări: cât durează programul X să ruleze pe mașina Y Această întrebare poate apărea pentru un programator care dorește să îmbunătățească eficiența unui program sau pentru un utilizator care decide să cumpere o mașină În capitolele anterioare (vezi Capitolul ), când discutăm despre optimizarea performanței unui sistem informatic, am presupus că această problemă poate fi rezolvată cu o acuratețe exhaustivă Am încercat să introducem o măsură a performanței în cicluri pe element (CPE) cu o precizie de două zecimale Acest lucru a necesitat o precizie de , % pentru procedurile cu un CPE de ordinul În acest capitol, vom reveni la această problemă și vom arăta că nu este deloc o sarcină ușoară Ar fi de așteptat ca efectuarea unor măsurători de timp extrem de precise pe un sistem informatic să fie destul de simplă La urma urmei, pentru orice combinație specială de program și date, mașina va trebui să execute o secvență fixă de instrucțiuni Execuția fiecărei instrucțiuni este controlată de ceasul intern de precizie al procesorului Există mulți factori care afectează execuția unui program, care se pot schimba de la o execuție de program la alta Calculatoarele pur și simplu nu rulează un singur program la un moment dat Ei nu sunt Partea a II-a Executarea programelor în sistem comută intermitent de la un proces la altul, executând un cod de program „în numele” unui proces, înainte de a trece la următorul Programarea exactă a resurselor procesorului pentru un singur program depinde de factori precum numărul de utilizatori colocați pe sistem, traficul de rețea și sincronizarea operațiunilor pe disc Modelele de implementare a accesului la cache depind nu numai de referințele curente din programul în care măsurăm, ci și de alte procese care rulează în același timp În cele din urmă, logica predicțiilor ramurilor condiționate necesită să se ia în considerare dacă o ramură condiționată va depinde de istoria desfășurării evenimentelor din program Acest istoric de dezvoltare se poate schimba de la o execuție a programului la alta În acest capitol, descriem cele două mecanisme principale utilizate de sistemele informatice pentru înregistrarea timpilor de numărare, unul bazat pe utilizarea unui temporizator de joasă frecvență care întrerupe periodic procesorul, celălalt pe utilizarea unui contor care crește cu fiecare ciclu de oscilatorul Programatorii de aplicații pot accesa primul mecanism de sincronizare apelând funcțiile bibliotecii Pe unele sisteme, cronometrele pot fi accesate folosind funcțiile de bibliotecă, dar pe altele, va trebui să scrieți programe în limbaj de asamblare Am amânat până acum discuția despre programul de sincronizare pentru că necesită înțelegerea unor aspecte ale modului în care funcționează atât hardware-ul, cât și CPU-ul și modul în care sistemul de operare controlează execuția procesului Folosind aceste două mecanisme de sincronizare, vom explora metode pentru obținerea unor măsurători fiabile ale performanței programului Vom vedea că variația valorilor de timp măsurate cauzată de comutarile de context tinde să crească și, prin urmare, trebuie eliminată Varianțele cauzate de alți factori, cum ar fi accesele în cache și predicția condițională a ramurilor, sunt gestionabile prin evaluarea comportamentului programului în condiții bine specificate În general, putem obține măsurători precise pentru timpi care sunt fie foarte scurti (mai puțin de ms) sau foarte lungi (mai mari de s), chiar și pe mașini extrem de ocupate Intervalele de la ms la s necesită o atenție deosebită acordată preciziei măsurătorilor În mare măsură, problemele de măsurare a eficienței execuției programului sunt decise de dezvoltatorii sistemelor informatice înșiși Diverse grupuri și indivizi își dezvoltă propriile metode pentru astfel de măsurători, dar nu există o literatură disponibilă pe scară largă pe acest subiect important Companiile individuale și grupurile de cercetare, în căutarea de a măsura performanța execuției programului cu o acuratețe sporită, au instalat adesea mașini special configurate care sunt capabile să minimizeze orice posibile cauze ale încălcărilor de sincronizare, de exemplu, prin restricționarea accesului sau dezactivarea majorității sistemelor de operare și a rețelei Servicii Avem nevoie de metode pe care programatorii de aplicații le-ar putea folosi pe mașinile normale, dar nu avem instrumente disponibile în acest scop Pe baza acestui lucru, ne vom dezvolta propriile instrumente Capitolul Măsurarea timpului de execuție a programului În acest capitol, ne vom ocupa de aceste probleme unul câte unul Vom descrie un proiect și o evaluare pentru mai multe experimente care vor oferi capacitatea de a obține măsurători precise pe un set limitat de sisteme Nu este întotdeauna posibil să găsiți o descriere detaliată a studiilor experimentale în cărțile de acest nivel În general, mulți se așteaptă să citească recomandările finale, mai degrabă decât o descriere a pe care se bazează recomandările În cazul nostru, însă, ne-am abține mai degrabă de la a face recomandări categorice pentru măsurarea timpului de execuție a unui program arbitrar pe un sistem arbitrar Cu toate acestea, sperăm că veți experimenta singur în acest domeniu și veți scrie propriile programe pentru a măsura performanța Sperăm că studiile noastre de caz vă vor ajuta în această problemă Vom rezuma constatările noastre sub forma unui protocol pentru a ajuta la organizarea cursului experimentului Trecerea timpului într-un sistem informatic Calculatoarele funcționează pe două scale de timp diferite La nivel micro, computerele execută instrucțiuni într-un ciclu al ciclului generator, iar fiecare ciclu al ciclului durează doar aproximativ o nanosecundă (ns) La nivel macro, procesorul trebuie să răspundă la evenimente externe care durează un timp măsurat în milisecunde (ms) De exemplu, în timpul redării video, afișajul grafic pentru majoritatea computerelor ar trebui să fie actualizat la fiecare ms Discurile durează de obicei aproximativ ms pentru a-și mișca capetele Procesorul comută continuu între mai multe sarcini la nivel macro-temporal, dedicând aproximativ - ms fiecărei sarcini În aceste circumstanțe, utilizatorului i se pare că sarcinile rulează în același timp, deoarece omul nu poate distinge durate mai mici de ms În acest timp, procesorul poate executa milioane de instrucțiuni Nivel micro Nivel macro Adunarea întregului i - înmulțirea FP / I— divizia FP Ecranul Dump To Disk Refresh - Apăsări de taste ns E- ms ms E- E- Timp (în secunde) s E+ Orez Cronologie pentru evenimente într-un sistem informatic Pe fig Figura prezintă diferite tipuri de evenimente pe o scară logaritmică, unde durata unui eveniment la nivel micro este măsurată în nanosecunde și durata unui eveniment la nivel macro este măsurată în milisecunde Evenimentele la nivel micro sunt controlate de subrutinele sistemului de operare care durează aproximativ Partea a II-a Executarea programelor în sistem - mii de cicluri ale ciclului generatorului Aceste intervale de timp sunt măsurate în ms Deși poate părea un calcul uriaș, toată această procesare este mult mai rapidă decât procesarea evenimentelor la nivel macro, încât aceste rutine reprezintă doar o mică parte din utilizarea CPU y p rjn en il ? •! Când utilizatorul editează fișiere într-un editor în timp real, cum ar fi EMACS, fiecare apăsare a tastei generează un semnal de întrerupere Sistemul de operare trebuie să programeze întreținerea procesului de editare pentru fiecare apăsare a tastei Să presupunem că avem un sistem cu un generator de GHz și să presupunem că există de utilizatori pe sistem care folosesc EMACS și tastează la de cuvinte pe minut Să presupunem că numărul mediu de caractere dintr-un cuvânt este de Să presupunem, de asemenea, că rutina de apăsare a tastei sistemului de operare necesită o medie de de cicluri de generator per apăsare de tastă Care este proporția din utilizarea totală a procesorului cauzată de procesarea apăsării tastei? Programarea procesului și întreruperile cronometrului Evenimentele externe, cum ar fi apăsările de taste, operațiunile de pe disc și activitatea de rețea generează întreruperi pentru planificatorul sistemului de operare, asociate cu o posibilă trecere la un alt proces Chiar și în absența unor astfel de evenimente, uneori este necesară trecerea procesorului de la un proces la altul, astfel încât utilizatorul să aibă impresia că procesorul rulează mai multe programe în același timp Pentru a face acest lucru, computerele au un temporizator extern care generează periodic un semnal de întrerupere pentru procesor Intervalul de timp dintre aceste semnale de întrerupere se numește interval de timp (timpul de interval) Când are loc o întrerupere a temporizatorului, programatorul sistemului de operare poate fie să continue executarea procesului curent, fie să comute la alt proces Această perioadă de timp ar trebui setată suficient de scurtă pentru a se asigura că procesorul comută între sarcini suficient de des pentru a da iluzia de a rula mai multe sarcini în același timp Pe de altă parte, trecerea de la un proces la altul necesită mii de cicluri ale ciclului generatorului pentru a salva starea procesului curent și a seta starea procesului următor, iar astfel setarea intervalului prea scurt ar provoca o degradare semnificativă a performanței Intervalele tipice ale temporizatorului sunt între I și ms, în funcție de procesor și de configurația acestuia Raportul nivelurilor de timp în computere Este interesant să comparăm computerul DEC VAX- / cu procesoarele moderne Această mașină a fost introdusă în cu un preț de pornire de aproximativ USD A devenit prima mașină utilizată pe scară largă care rulează sistemul de operare Unix Rețineți că intervalul temporizatorului pe această mașină a fost, ca de obicei, de ms, chiar dacă prețul său era Capitolul Măsurarea timpului de execuție a programului Procesorul de traul a fost de peste de ori mai lent decât procesorul unei mașini moderne La nivel macro, scara de timp nu s-a schimbat, în ciuda faptului că scara de timp la nivel micro a devenit mult mai rapidă Pe fig Figura prezintă o secvență de operații care rulează pe o perioadă ipotetică de ms pe un sistem cu un interval de întrerupere a temporizatorului de ms În această perioadă, există două procese active: A și B Procesorul execută alternativ o parte a procesului A, apoi partea B și așa mai departe modul privilegiat (modul kernel), realizând funcțiile sistemului de operare în numele programului , cum ar fi procesarea acceselor la pagina, intrare sau ieșire lipsă Amintiți-vă că operațiunile nucleului sistemului de operare sunt considerate parte a fiecărui proces obișnuit, nu un proces separat Planificatorul sistemului de operare este apelat de fiecare dată când apare un eveniment extern sau o întrerupere a temporizatorului Întreruperile temporizatorului din figură sunt indicate prin marcaje temporale Aceasta înseamnă că, de fapt, la fiecare marcaj de timp, nucleul arată o anumită activitate, dar pentru simplitate, nu arătăm acest lucru în figură Când planificatorul comută procesarea de la procesul A la procesul B, trebuie să intre în modul privilegiat pentru a salva starea procesului (rămâne încă în procesul A) și apoi restabili starea procesului B (în timp ce rămâne în procesul B) Astfel, nucleul este activ în timpul fiecărei tranziții de la un proces la altul Alteori, nucleul se poate trezi fără o comutare de proces, cum ar fi atunci când o pagină lipsă poate fi accesată utilizând o pagină care este deja în memorie Din punct de vedere al sistemului — — aa— — p — Utilizator televizor, Perspectivă de aplicare Orez Diferențe în reprezentarea timpului de către sistem și aplicație II Activ C Inactiv Curgerea timpului din punct de vedere al programului aplicativ Din punctul de vedere al unui program de aplicație, trecerea timpului poate fi gândită ca perioade alternante când programul este activ și inactiv (în așteptarea ca sistemul de operare să-l programeze pentru execuție) Pe fig Figura arată modul în care programul A ar vedea trecerea timpului Este activ în perioadele de timp marcate în culoare deschisă; restul timpului este inactiv Partea a II-a Executarea programelor în sistem O aplicație efectuează calcule utile numai atunci când procesul său rulează în modul utilizator Ca mijloc de înregistrare a alternanței dintre perioadele de timp active și inactive, am scris un program care monitorizează și înregistrează continuu durata perioadelor de inactivitate Apoi generează un protocol de urmărire (urmă), care arată alternanța activității și inactivitatea Detaliile acestui program vor fi descrise mai târziu în acest capitol Un exemplu de astfel de urmă, generat atunci când rulează pe o mașină Linux tactată la aproximativ MHz, este prezentat în Lista Fiecare perioadă este etichetată fie activă (A) fie inactivă (I) Pentru identificare, perioadele sunt numerotate de la la Pentru fiecare perioadă se indică ora de începere (relativă la începutul urmei) și durata acesteia Durata intervalelor de timp este exprimată atât în numărul de cicluri ale ciclului generator, cât și în ms Această urmărire se întinde pe un total de de perioade de timp ( active și inactive) pentru o durată totală de , ms În acest exemplu, perioadele de inactivitate sunt destul de scurte, cea mai mare fiind de , ms Majoritatea acestor perioade de inactivitate au fost cauzate de întreruperi ale temporizatorului Procesul a fost activ pentru aproximativ , % din timpul total de observare Rețineți că intervalul de timp dintre perioadele de activitate rămâne constantă Aceste limite sunt cauzate de întreruperi ale temporizatorului Timp AO ( , ms), durată timp ( , ms), durata A timp ( , ms), durata timp ( , ms), durata Timp A ( , ms), durata ori ( , ms), durata Ora AZ ( , ms), durata timp ( , ms), durata Ora A ( , ms), durata ori ( , ms), durata Timp A ( , ms), durata ori ( , ms), durata Ora A ( , ms), durata timp ( , ms), durata Ora A ( , ms), durata timp ( , ms), durata Ora A ( , ms), durata oră ( , ms), durată Ora A ( , ms), durata timp ( , ms), durata ( , ms) ( , ms) ( , ms) ( , ms) ( , ms) ( , ms) ( , ms) ( , ms) ( , ms) ( , ms) ( , , ms) ( , , ms) ( , ms) , ms) ( , ms) ( , ms) ( , ms) ( , ms) ( , ms) ( , ms) Din punctul de vedere al programului de aplicație, funcționarea procesorului constă în perioade în care programul se execută activ și când este inactiv In acest Capitolul Măsurarea timpului de execuție a programului Urmărirea arată jurnalul acestor perioade pentru program cu o durată totală de , ms Programul a fost activ în , % din această perioadă de timp Lista arată un fragment din urmă atunci când există un alt proces activ care utilizează același procesor O reprezentare grafică a acestei urme este prezentată în Fig Rețineți că liniile de timp nu sunt continue deoarece începem la , ms în această urmă Este posibil să observați că în acest exemplu, atunci când procesează unele dintre întreruperile temporizatorului, sistemul de operare efectuează și o schimbare a contextului procesului Ca urmare, fiecare proces este activ doar aproximativ % din timp ^Listing ^Un alt exemplu de urmărire A A A A A A A A ora timp ora ora ora ora ora ora ora ora ora ora ora ora ( , ( , ( , ( , ( , ( , ( , ( , ( , ( , ( , ( , ( , ( , ( , ( , ms) ms) ms) ms) ms) ms) ms) ms) ms) ms) ms) ms) ms) ms) ms) ms) duration duration duration duration duration duration duration duration duration duration duration duration duration duration duration duration duration duration ms) ms) ms) ms) ms) ( , ( , ( , ( , ( , ))))) ( , ms) ( , ms) ( , ms) ( , ms) ( , ms) ( , ms) ( , ms) ( , ( , ) ( , ms) ms) ms) ms) Această urmărire arată un fișier jurnal de perioadă pentru un program cu o durată totală de , ms Procesul a fost activ timp de , % din acest interval de timp Partea a II-a Executarea programelor în sistem DEJA ?l Acest exercițiu este legat de interpretarea secțiunii de urmărire din Listarea În ce momente în timpul acestui fragment de urmărire au avut loc întreruperi ale temporizatorului? Care dintre aceste întreruperi a avut loc în timp ce procesul urmărit era activ și care a avut loc când era inactiv? De ce cele mai lungi perioade de inactivitate sunt mai lungi decât cele mai lungi perioade de activitate? Pe baza modelului de perioade active și inactive adoptat în această urmărire, ce procent din timp credeți că procesul de urmărire va fi inactiv dacă luăm în considerare o perioadă mai lungă de timp? Măsurarea timpului prin numărarea numărului de intervale Sistemul de operare folosește și un cronometru pentru a ține evidența timpului total luat de fiecare proces Acest calcul oferă o măsurare oarecum inexactă a timpului de execuție a programului Pe fig Figura arată grafic cum funcționează această numărare folosind exemplul de sistem prezentat în fig Perioada de timp în care se execută un singur proces, aici vom numi intervalul de timp (segment de timp) Orez Măsurarea timpului de proces prin intervale de numărare: a - măsurarea timpului prin intervale de numărare; b - timpul real Rolul sistemului de operare Când are loc o întrerupere a temporizatorului, sistemul de operare determină ce proces a fost activ și crește contorul procesului respectiv cu un interval de temporizare Acesta va crește ora sistemului dacă sistemul este în modul privilegiat, iar ora utilizatorului în caz contrar Pe fig , a arată un astfel de număr pentru două procese Marcajele temporale arată când apar întreruperile temporizatorului În fiecare, este marcat un numărător care primește un increment: Au sau As - pentru procesul utilizatorului A sau ora de sistem; Vi sau Bs - Capitolul Măsurarea timpului de execuție a programului pentru procesul utilizatorului B sau ora sistemului Fiecare marca temporală are o inscripție în funcție de activitatea sa Rezultatul numărării arată că procesul A a folosit un total de ms: DAR dintre ele este timpul utilizatorului, iar este timpul sistemului De asemenea, arată că B a folosit un total de ms: dintre ele sunt timpul utilizatorului și sunt timpul sistemului Citirea datelor de la temporizatoare Când execută o comandă dintr-un shell Unix, utilizatorul poate prefix comanda cu cuvântul timp pentru a măsura timpul de execuție al comenzii De exemplu, pentru a determina timpul de execuție al programului prog folosind opțiunea de linie de comandă -p , utilizatorul poate pur și simplu să tastați comanda unix> time prog -n După finalizarea execuției programului, shell-ul va imprima o linie de statistici rezumative ale timpului de execuție, de exemplu, în următoarea formă: u S : % + k + io pf+ w Primele trei numere din această linie sunt intervalele de timp Primele două arată numărul de secunde de timp de utilizator și de sistem Rețineți că ambele numere au un în a treia zecimală Cu un interval de cronometru de ms, toate măsurătorile de timp sunt înmulțite cu o sută de secunde Al treilea număr este timpul total scurs, dat în minute și secunde Rețineți că timpii de sistem și utilizator se adună până la , s: mai puțin de jumătate din timpul scurs ( , s), indicând faptul că procesorul rula alte procese în același timp Procentul arată ce procent din timpul total scurs pe care utilizatorul și sistemul l-au partajat, de exemplu ( , + , )/ , = , Statisticile rămase caracterizează comportamentul I/O și paginarea Programatorii pot citi și datele cronometrului de proces apelând funcția bibliotecă de timp, declarată după cum urmează: Ainclude struct tms { clock t tms utime; /♦ oră personalizată */ clock t tms stime; /* timpul sistemului */ clock t tms cuttime; /* Ora utilizatorului procesului copil terminat */ clock t tms cstime; /* ora de sistem a procesului copil încheiat ★/ I; clock t times(struct tms *buf); Timpul este măsurat în unități de măsură numite ticuri de ceas Constanta CLK TCK determină numărul de bifături de ceas pe secundă Tipul de date al variabilei clock t este de obicei definit ca un întreg lung Câmpurile pentru timpii procesului copil oferă timpul total al proceselor secundare care s-au încheiat și au fost eliminate Astfel, timpii nu pot fi folosiți pentru a ține evidența timpului folosit de orice acțiune Partea a II-a Executarea programelor în sistem rulează (nu sunt eliminate) procese copil Valoarea timpului returnată de ori este măsurată prin numărul total de bifături ale ceasului sistemului care au fost numărate de la pornirea sistemului Prin urmare, puteți calcula timpul total (în bifări ale ceasului de sistem) care a trecut între două puncte dintr-un program executabil făcând două interogări la timpi și calculând diferența valorilor returnate Standardul ANSI C definește, de asemenea, o funcție ciosk care măsoară timpul total utilizat de procesul curent: #include clock t clock(void); Deși valoarea returnată în declarație este de același tip de ceas t folosit de funcția times, cele două funcții nu exprimă timpul în aceleași unități Pentru a converti timpul raportat de siosk în secunde, acesta trebuie împărțit la constanta CLOCKSPERSEC definită Această valoare nu trebuie să fie aceeași cu constanta CLK TCK Precizia cronometrului procesului Ca exemplu, se poate face referire la Fig , care arată că acest mecanism de sincronizare este mai degrabă aproximativ Pe fig Figura b arată timpul efectiv utilizat de aceste două procese Procesul A a rulat doar , ms, dintre care , ms au fost în modul utilizator și , ms în modul privilegiat Procesul B a rulat doar , ms, dintre care , ms au fost în modul utilizator și , ms în modul privilegiat Schema de numărare a intervalelor nu încearcă să determine timpul cu o precizie mai mare decât intervalul temporizatorului EXERCIȚIUL Ce ar trebui să raporteze sistemul de operare dacă orele utilizatorului și ale sistemului pentru secvența de execuție sunt aceleași ca cele prezentate în Fig , ? Setați intervalul temporizatorului la ms Orez Secvența de execuție EXERCIȚIUL Pe un sistem cu un interval de temporizator de ms, o parte a procesului este înregistrată ca necesitând ms de timp total de sistem și utilizator Care poate fi timpul efectiv minim și maxim utilizat în acest segment? UNELE EXERCIȚII Ce ar trebui să înregistreze sistemul și contoarele de timp ale utilizatorului pentru urmărirea Listing - ? Cum se potrivește acest lucru cu timpul real în care fiecare proces a fost activ? Capitolul Măsurarea timpului de execuție a programului Pentru programele care rulează suficient de lung (cel puțin câteva secunde), erorile din această schemă tind să se anuleze reciproc Eroarea așteptată, mediată pe mai multe segmente, se apropie de zero Din punct de vedere teoretic, însă, nu există nicio justificare pentru modul în care aceste măsurători pot diferi de valorile adevărate Pentru a testa acuratețea acestei metode de măsurare a timpului, am desfășurat o serie de experimente care compară intervalul de timp TIP măsurat de sistemul de operare pentru un calcul tipic cu estimarea noastră a ceea ce ar fi intervalul de timp TCI dacă resursele sistemului ar fi dedicate exclusiv executarea acelui calcul În general, Tc va diferi de Tm din mai multe motive: Erorile proprii inerente schemei de calcul a intervalului pot duce la faptul că Tsh va fi fie mai mic, fie mai mare decât Tc Activitatea kernel-ului cauzată de întreruperi ale temporizatorului consumă - % din numărul total de cicluri CPU, dar aceste cicluri nu sunt luate în considerare corespunzător După cum puteți vedea din urmărire, această activitate se încheie înainte de următoarea întrerupere a temporizatorului și, prin urmare, nu poate fi luată în considerare în mod explicit Cu toate acestea, acest lucru reduce numărul de cicluri disponibile procesului care rulează în următorul interval de timp Acest lucru va determina o tendință de creștere a Tm față de Tc Când procesorul trece de la o sarcină la alta, memoria cache încetează să-și îndeplinească funcțiile în timpul perioadei de tranziție Astfel, procesorul nu funcționează la fel de eficient atunci când comută între programul nostru și alții, precum ar fi dacă programul nostru ar rula continuu Acest factor va determina o tendință de creștere a Tm în raport cu Tc Cum putem determina valoarea lui Tc pentru exemplul nostru de calcul va fi discutat mai târziu în acest capitol Pe fig Figura prezintă rezultatele acestui experiment, efectuat în două condiții diferite de încărcare Graficele prezintă măsurători ale erorii normalizate, definite de raportul (Tm - Tc)/Tc în funcție de Tc Această eroare este negativă dacă Tm este mai mic decât TCi și pozitivă dacă Tm este mai mare decât Tc Aceste două secvențe arată rezultatele măsurătorilor obținute cu două moduri de încărcare diferite Secvența etichetată „boot ” corespunde cazului în care procesul care efectuează calculul eșantionului este singurul proces activ Secvența etichetată „încărcare ” corespunde cazului în care alte procese încearcă să efectueze calcule similare A doua secvență corespunde modului de încărcare crescută: sistemul încetinește vizibil răspunsul la apăsările de taste și la alte solicitări de servicii Observați gama largă de valori de eroare văzute în acest grafic În general, doar acele măsurători care se încadrează în % din valoarea adevărată pot fi considerate acceptabile, deci pot fi luate în considerare doar erorile între - , și + , Sub aproximativ ms ( intervale de temporizator) măsurătorile sunt inexacte din cauza metodei de sincronizare brută Metoda de numărare a intervalelor este potrivită numai pentru Partea a II-a Executarea programelor în sistem pentru a efectua măsurători privind calculele lungi: milioane de cicluri ale ciclului generatorului sau mai mult În plus, vedem că această eroare este în general în intervalul între , și , , adică în % Nu există nicio diferență semnificativă între aceste două moduri de pornire diferite De asemenea, rețineți că erorile sunt influențate pozitiv: eroarea medie pentru toate măsurătorile la Tm > ms este de aproximativ , , datorită faptului că întreruperile temporizatorului consumă aproximativ % din timpul CPU Intel Pentium III, Linux, temporizator procesor -^-Încărcare -ѳ- Încărcare unsprezece Orez Calculul preciziei unei măsurări cu intervale Acest experiment arată că temporizatoarele de proces sunt utile doar pentru a obține estimări aproximative ale eficienței execuției programului Sunt prea grosiere pentru a fi utilizate pentru o măsurătoare cu o durată mai mică de ms Pe această mașină, acestea au o părtinire sistematică de aproximativ % Principalul avantaj al acestui mecanism de sincronizare este că precizia lui nu depinde prea mult de sarcina sistemului Contoare de ceas Pentru a oferi măsurători de sincronizare mai precise, multe procesoare includ și un temporizator care funcționează la nivelul ciclului de ceas al oscilatorului Acest cronometru este un registru special care primește o natură Capitolul Măsurarea timpului de execuție a programului schenie cu fiecare măsură a ciclului În acest caz, instrucțiunile speciale ale mașinii pot fi folosite pentru a citi valoarea acestui contor Nu toate procesoarele au un astfel de contor, iar cele care au variază considerabil în detaliile implementării acestuia Ca urmare, nu există o interfață standard, independentă de platformă, prin care programatorii să poată utiliza aceste contoare Pe de altă parte, cu foarte puțin cod de asamblare, de obicei nu este dificil să creați o interfață de program pentru orice mașină dată Contoare de ceas în IA Toate măsurătorile de sincronizare despre care am vorbit până acum au fost făcute folosind contorul ciclului de ceas al oscilatorului IA În arhitectura IA , contoarele de ceas au fost introduse cu microarhitectura P (Pentium Pro și procesoare ulterioare) Contorul ceasului este un număr nesemnat pe de biți Pentru un procesor de GHz, acest contor va completa o revoluție (adică, numără toate numerele de la e - la ) în , x secunde, adică de ani Pe de altă parte, dacă sunt numărați doar cei de biți mai puțin semnificativi ai acestui contor (ca un întreg fără semn), o revoluție completă ar dura doar , secunde Prin urmare, se poate înțelege de ce designerii IA au decis să implementeze un contor pe de biți Contorul IA este accesat folosind comanda rdtsc Această comandă nu necesită niciun parametru Setează cei de biți înalți ai contorului în registrul %edx și cei de biți mai mici în registrul %eax Pentru a oferi o interfață pentru programele C, este de dorit să includeți această comandă într-un corp de procedură: void access counter(nesemnat *hi, nesemnat *lo); Această procedură ar trebui să seteze zona de memorie hi la valoarea celor de biți înalți ai contorului și la cei de biți mici în i Implementarea accesului la contor este un exercițiu simplu de utilizare a asamblatorului încorporat în GCC, descris în Sec , codul este prezentat în Lista |:Listing^( > Implementarea interfeței software k^even^i^^^grzhv /* inițializați contorul ceasului */ static unsigned cyc hi = ; static unsigned cycl lo = ; cinci /* setează *hi și *lo la biții înalți și jos ai contorului ceasului; Implementarea necesită codul de asamblare pentru a utiliza comanda rdtsc ★/ void access counter(unsigned *hi, unsigned *lo) nouă { asm("rdtsc; movl %%edx,% ; movl %%eax,% " /♦ contor ceas ♦/ Partea a II-a Executarea programelor în sistem : "=r" (*hi), "=r" (* o) /* și treceți rezultatul la */ : /* fără ieșire */ /* aceste două variabile de intrare */ : „%edx”, „%eax”); paisprezece } cincisprezece /* înregistrează valoarea curentă a contorului ceasului */ void start counter() optsprezece { accesS-Counter(&cyc hi, &cyc lo); douăzeci } /* returnează numărul de bifături numărate de la ultimul apel start counter */ dublu get counter() { nesemnat ncyc hi, ncyc lo; nesemnat hi, ia, împrumuta; dublu rezultat; /* obține valoarea contorului ceasului */ access counter(&ncyc hi, &ncyc lo); /* efectuează scăderea cu dublă precizie */ Io = psus o - sus o; împrumuta = Io > ncyC-lo; hi = ncyc hi - cyc hi - împrumuta; rezultat = (dublu) hi * ( « ) * + lo; dacă (rezultat UV , M , V I Listări Măsurarea ~ r" timp dublu P cald() { P(); /* încălzește memoria cache */ start counter(); cinci R O ; return get counter(); După primul apel către P, înainte de începerea măsurătorii, codul programului folosit de P va fi plasat în memoria cache de instrucțiuni Acest cod minimizează, de asemenea, efectul pierderii în cache de date, deoarece primul apel către P va împinge și datele accesate de P în memoria cache de date Pentru procedurile procA sau procB, măsurarea cu timePwarm ar dura de cicluri O astfel de tehnică poate fi considerată justificată dacă ne așteptăm ca codul programului nostru să acceseze în mod repetat aceleași date Cu toate acestea, pentru unele aplicații, este posibil să accesăm date noi cu fiecare nouă execuție De exemplu, o procedură care copiază date dintr-o zonă de memorie în alta este cel mai probabil să fie apelată într-o situație în care niciun bloc nu este stocat în cache Procedura de timp P cald ar tinde să reducă timpul de execuție pentru o astfel de procedură Pentru rgoA sau rgoB, acest lucru ar dura , și nu acele - de cicluri măsurate Pentru a ne asigura că codul de sincronizare măsoară eficiența unei proceduri în care nu sunt date pre-cache, putem șterge memoria cache de toate datele de încărcare utilă înainte de a efectua măsurarea efectivă Următoarea procedură face acest lucru pentru un sistem cu o dimensiune cache de cel mult KB (Listing ) ^ Listarea E b Golirea memoriei cache ѵ - G ' / / , І "Ch "•••%••" * rt ^ * > Gb "GN " " « * « J unu /* numărul de octeți din cel mai mare cache de golit */ #define CBYTES( " ) #define CINTS(CBYTES/sizeof(int)) Partea a II-a Executarea programelor în sistem /* matrice mare pentru cache */ static int dummy[CINTS]; volatile int sink; opt /* eliminați blocurile existente din cache-urile de date ★/ void clear cache() unsprezece { int i; int suma = ; paisprezece pentru (i = ; i ѵk \ □ L/ - numărul maxim de măsurători din experiment În implementarea noastră, se efectuează o secvență de teste și ajustări de sortare în matricea K a celor mai rapide valori Cu fiecare măsurătoare nouă, se verifică dacă rezultatul acesteia este mai rapid decât cel curent în poziția matricei Dacă da, atunci elementul matricei K este înlocuit și apoi se realizează o succesiune de permutări ale pozițiilor adiacente ale matricei Acest proces continuă până când fie criteriul de eroare este satisfăcut, iar acest lucru va indica că procesul de măsurare a „convergit”, fie limita A/ este depășită și credem că măsurătorile nu converg Evaluare experimentală Am efectuat o serie de experimente pentru a testa acuratețea schemei de măsurare K-best Printre întrebările la care am vrut să se răspundă au fost următoarele: Ce precizie oferă această schemă de măsurare? În ce condiții și cât de repede converg măsurătorile? Poate un circuit dat să determine acuratețea propriilor măsurători? Una dintre dificultățile în proiectarea unui astfel de experiment este necesitatea de a cunoaște timpul real de execuție al programelor pe care le testăm Numai atunci putem determina acuratețea măsurătorilor noastre Știm că contorul de cicluri este precis până când calculul este întrerupt Șansa de întrerupere este scăzută pentru calculele care sunt mult mai scurte decât intervalul temporizatorului și când sunt executate pe o mașină puțin încărcată Vom folosi această proprietate pentru a obține estimări fiabile ale timpului real de execuție Ca obiect de testare, am folosit o procedură care scrie în mod repetat valori într-o matrice de numere întregi și apoi le citește înapoi, similar codului programului pentru ștergerea memoriei cache Prin setarea numărului de repetări, r, am putut genera calcule pentru intervalele de timp necesare În primul rând, am determinat timpul de execuție așteptat al procedurii în funcție de r, notându-l ca T(r) când r variază de la la (corespunzător unei schimbări în timp de la , la , ms) și am calculat abaterea folosind metoda celor mai mici pătrate pentru formula având forma Г(г) = mr + b Pentru valori mici ale lui r, după ce au efectuat de măsurători pentru fiecare valoare a lui r pe un sistem ușor încărcat, am obținut o dependență foarte precisă r(r) Analiza celor mai mici pătrate a arătat că formula G(r) = , r + (în unități ale numărului de impulsuri de ceas Capitolul Măsurarea timpului de execuție a programului bufniță) corespunde acestor date cu o eroare maximă de cel mult , % Acest lucru ne-a dat încredere în capacitatea de a prezice cu precizie timpul real de calcul pentru procedură în funcție de r Am măsurat performanța de execuție folosind schema K-best cu parametrii K = , e = , și Lf = Au fost luate măsurători pentru o varietate de valori r pentru a obține un timp de execuție așteptat cuprins între , și ms Pentru fiecare dintre rezultatele măsurătorii M(r), am calculat eroarea de măsurare Em(r) folosind formula iad \u d (Mg) -Dg)) / Dg) Pe fig Figura prezintă rezultatele unei verificări experimentale a corectitudinii schemei K-best pe un Intel Pentium III care rulează Linux În această figură, am arătat eroarea de măsurare Em(r) în funcție de \r) în ms Rețineți că Et(r) este prezentat pe o scară logaritmică: fiecare linie orizontală reprezintă o diferență de ordin de mărime a erorilor de măsurare Pentru a obține o precizie de %, eroarea nu trebuie să depășească , Cifra nu arată erori mai mici de , (adică , %), deoarece setarea experimentului nostru nu oferă o precizie atât de mare Intel Pentium III Linux Descarca unu -e- Zagr Descărcați unsprezece Orez Verificarea experimentală a corectitudinii schemei de măsurare K-best pe un sistem Linux Aceste trei secvențe reprezintă erori în trei moduri de pornire diferite Astfel, circuitul nostru poate fi folosit pentru a măsura timpi de execuție relativ scurti chiar și pe o mașină extrem de încărcată După Partea a II-a Executarea programelor în sistem Secvența „încărcare ” corespunde cazului în care există un singur proces activ Pentru timpi de execuție mai mari de ms, măsurătorile Tm supraestimează sistematic timpul de calcul al Tc cu aproximativ - % Aceste supraestimări se datorează timpului petrecut procesând întreruperile temporizatorului Ele sunt în concordanță cu urma (vezi Lista ), care arată că chiar și pe o mașină puțin încărcată, o aplicație poate rula doar - % din timp Secvențele „boot ” și „boot ” arată eficiența execuției atunci când alte procese se execută activ În ambele cazuri, măsurătorile devin iremediabil de inexacte pentru timpi de execuție mai mari de aproximativ ms Rețineți că o eroare de , înseamnă că Tm este de două ori Tc, în timp ce o eroare de , înseamnă că Tm este de ori Tc Evident, sistemul de operare programează fiecare proces activ pentru execuție la un interval de timp separat Când ambele procese sunt active, fiecare dintre ele primește cota sa, egală cu \/n din timpul total al procesorului Pe baza acestor rezultate, concluzionăm că schema K-best oferă doar rezultate precise pentru calcule foarte scurte Acest lucru face imposibilă măsurarea timpilor de execuție mai mari de aproximativ ms, mai ales când alte procese sunt active În plus, am constatat că programul nostru de măsurare nu a putut determina în mod fiabil dacă o anumită măsurătoare a fost într-adevăr precisă Procedura noastră de măsurare calculează eroarea prezisă folosind formula = (ѵ* - V,)/V|, unde V/ este cea mai mică dimensiune Această formulă calculează cât de repede este atins criteriul nostru de convergență Am constatat că aceste estimări erau prea optimiste Chiar și pentru cazul de încărcare , în care măsurătorile au fost oprite cu un factor de , programul a estimat în mod constant eroarea sa ca fiind mai mică de , Setarea valorii K În experimentele noastre timpurii, am setat în mod arbitrar parametrul K la , specificând numărul de măsurători necesare pentru a finaliza testul, atâta timp cât citirile au fost într-un interval îngust care a determinat răspândirea celui mai rapid Pentru a aprecia mai bine efectul acestui factor, am efectuat o serie de măsurători folosind valori K cuprinse între și , așa cum se arată în Fig Am făcut aceste măsurători pentru timpi de execuție de până la ms, deoarece aceasta este limita superioară a fiabilității circuitului nostru Dacă setăm K = , atunci procedura revine după ce a fost făcută o singură măsurătoare (Figura ) Acest lucru poate duce la rezultate foarte imprevizibile, mai ales când mașina este extrem de încărcată Dacă apare o întrerupere a temporizatorului, rezultatul va fi extrem de inexact Chiar și fără un astfel de eveniment catastrofal, măsurătorile vor fi afectate de multe surse de efecte secundare Setarea K = îmbunătățește semnificativ precizia (Fig ) Pentru timpi de execuție mai mici de ms, obținem în mod constant o precizie mai bună de , % Capitolul Măsurarea timpului de execuție a programului Intel Pentium III, Linux K- Intel Pentium III, Linux K- Orez Eficiența schemei K-best pentru diferite valori ale lui K (continuare) Partea a II-a Executarea programelor în sistem Intel Pentium III Linux K = -o- Zagr -o- Încărcare -l- Încărcare unsprezece Timp CPU (ms) Pentium III, Linux K» Descarca unu -e- Zagr -a- Zagr unsprezece Timp CPU (ms) Orez Final Capitolul Măsurarea timpului de execuție a programului Setarea unor valori K și mai mari oferă rezultate mai bune atât în ceea ce privește stabilitatea, cât și precizia, până la o limită de aproximativ ms (vezi Figura ) Acest experiment arată că estimarea noastră brută inițială a K = este destul de rezonabilă Compensarea întreruperii temporizatorului Întreruperile temporizatorului sunt previzibile și sunt sursa unei erori sistematice mari în măsurătorile noastre pentru timpi de execuție mai mari de aproximativ ms Ar fi bine să scăpăm de această eroare sistematică scăzând din timpul de execuție a programului măsurat o estimare a timpului petrecut procesând întreruperile timerului Acest lucru va necesita determinarea a doi factori: Stabiliți cât timp durează procesarea unei singure întreruperi ale temporizatorului Trebuie să stabilim numărul minim de impulsuri de ceas necesare pentru a deservi o întrerupere a temporizatorului Acest lucru va asigura că supracompensarea poate fi evitată Determinați câte întreruperi ale temporizatorului apar în timpul măsurării Folosind o astfel de metodă, putem genera o urmă precum cea prezentată în Listările și , unde putem evidenția perioadele de inactivitate și stabilim durata acestora Unele dintre ele vor fi cauzate de întreruperi Intel Pentium III, compensarea cheltuielilor generale Linux Orez Măsurători cu compensare de întrerupere a temporizatorului Descarca unu -în- Descărcare Descărcați unsprezece Partea a II-a Executarea programelor în sistem de la cronometru, în timp ce altele vor fi cauzate de alte evenimente de sistem Dacă a avut loc o întrerupere a temporizatorului, putem determina utilizând procedura timer, deoarece valoarea returnată va crește cu una cu fiecare ciclu de ceas în care apare întreruperea temporizatorului Am efectuat această evaluare pentru de perioade de inactivitate și am constatat că procesarea minimă a întreruperii temporizatorului a necesitat de cicluri de ceas Pentru a determina numărul de întreruperi ale temporizatorului care apar în timpul execuției programului măsurat, apelăm pur și simplu funcția timpi de două ori: o dată la intrare și o dată după terminarea programului măsurat, apoi calculăm diferența dintre valorile returnate Pe fig arată rezultatele obținute în conformitate cu această schemă de măsurare revizuită După cum se arată în figură, acum putem obține măsurători foarte precise (în limita a , %) pe o mașină ușor încărcată, chiar și pentru programe care rulează pentru mai multe intervale de timp (cu întreruperi) Prin eliminarea erorii sistematice de la întreruperile temporizatorului, avem acum un circuit de măsurare foarte fiabil Pe de altă parte, putem observa că această compensare nu funcționează la mașinile extrem de încărcate Calculul pe alte mașini Deoarece schema noastră depinde foarte mult de politica de programare a timpului a unui anumit sistem de operare, am experimentat și alte trei configurații de sistem: Intel Pentium III rulează o versiune mai veche ( , nu ) a nucleului Linux; Intel Pentium II care rulează Windows NT Deși acest sistem folosește procesorul A , sistemul de operare este destul de diferit de Linux; Alpha Compaq care rulează Tru Unix Folosește un procesor complet diferit, dar sistemul de operare este similar cu Linux După cum se arată în fig , caracteristicile de performanță ale rulării unei versiuni mai vechi de Linux sunt foarte diferite La o mașină încărcată ușor, precizia măsurării este de , % pentru programe de aproape orice lungime Constatăm că în această versiune de Linux, procesorul petrece doar de cicluri procesând o întrerupere a temporizatorului Chiar și pe o mașină foarte încărcată, acest lucru permite proceselor să ruleze continuu timp de aproximativ ms la un moment dat Acest experiment arată că elementele interne ale sistemului de operare pot afecta foarte mult performanța sistemului și capacitatea noastră de a obține măsurători precise Pe fig Figura prezintă rezultatele obţinute pe un sistem Windows NT În general, aceste rezultate sunt similare cu cele obținute pentru un sistem Linux mai vechi Pentru calcule scurte sau pe o mașină ușor încărcată, am putea obține o precizie ridicată de măsurare În acest caz, eroarea a fost de aproximativ , (adică , %), dar nu , Cu toate acestea, acest lucru este suficient pentru majoritatea aplicațiilor În plus, am constatat că pragul dintre măsurători fiabile și nesigure este activat Capitolul Măsurarea timpului de execuție a programului Intel Pentium III Linux unu , , , , Timp CPU (ms) Orez Verificarea experimentală a corectitudinii schemei de măsurare K-best în sistemul IA /Linux Pentium II, Windows NT Descarca -B- Încărcare -a- Zagr unsprezece Orez Verificarea experimentală a corectitudinii schemei de măsurare K-best în sistemul Windows NT Partea a II-a Executarea programelor în sistem pe o mașină puternic încărcată este de aproximativ ms O caracteristică interesantă este că uneori se obțin măsurători precise pe o mașină foarte încărcată, chiar și pentru calcule care durează până la ms Evident, planificatorul NT permite uneori proceselor să rămână active pentru perioade mai lungi de timp, dar nu ne putem baza pe această caracteristică Rezultatele pentru Alpha Compaq sunt prezentate în fig Ca și înainte, vedem că la o mașină ușor încărcată, programele de aproape orice lungime pot fi măsurate cu o eroare mai mică de % Pe o mașină foarte încărcată, numai programele cu un timp de execuție de ms sau mai puțin pot fi măsurate cu precizie Compaq Alpha Descarca unu -e- Zagr Descărcați unsprezece Orez Verificarea experimentală a corectitudinii schemei de măsurare K-best pe sistemul Alpha Compaq La P? Și E ?-•/ Să presupunem că trebuie să facem măsurători pentru proceduri care necesită t ms Aparatul este foarte încărcat, procesul de măsurare nu va dura mai mult de ms într-o singură sesiune Fiecare test este un proces de măsurare pentru o singură execuție a procedurii Care este probabilitatea ca acest test să aibă loc de la început până la sfârșit (nu este anulat), presupunând că începe într-un anumit punct (arbitrar) într-un interval de timp de ms? Exprimați răspunsul în funcție de i, luând în considerare toate valorile posibile ale lui / Capitolul Măsurarea timpului de execuție a programului Care este numărul așteptat de încercări, astfel încât trei dintre ele să ofere măsurători fiabile ale procedurii (adică fiecare trebuie efectuată într-o secțiune de timp separată)? Exprimați-vă răspunsul în funcție de L Care credeți că ar trebui să fie valorile pentru t = și t = ? Rezultatele observației Aceste experimente arată că schema de măsurare K-best funcționează destul de bine pe un număr de mașini diferite În condițiile procesoarelor puțin încărcate, acesta produce în mod constant rezultate precise pe majoritatea mașinilor, chiar și pentru intervale lungi de calcul Doar noua versiune de Linux implică o suprasarcină suficient de mare a temporizatorului, care afectează serios acuratețea măsurătorilor Pentru acest sistem, compensarea costului general menționat îmbunătățește semnificativ acuratețea măsurării La mașinile cu încărcare mare, obținerea de măsurători precise este dificilă Majoritatea sistemelor au un timp maxim de execuție, dincolo de care precizia măsurării devine extrem de slabă Valoarea exactă a acestui prag depinde în mare măsură de sistem, dar este de obicei între și ms Măsurarea ceasului în timp real Contoarele de ceas pe care le folosim la IA sunt foarte precise în sincronizare, dar dezavantajul este că funcționează doar pe sistemele IA Ar fi bine să existe un instrument care este mai universal în ceea ce privește portabilitatea Am văzut că funcțiile bibliotecii times și ciosk sunt implementate folosind contoare de interval și, prin urmare, nu sunt foarte precise O altă posibilitate este să utilizați funcția de bibliotecă gettimeofday Această funcție accesează ceasul sistemului (ceasul sistemului) pentru a determina data și ora curente #include „time h” struct timeval { tv sec lung; /* secunde */ long tv usec; /* µs */ } int gettimeofday(struct timeval *tv, NULL); Această funcție scrie timpul într-o structură transmisă acesteia din programul apelant Structura constă din două câmpuri: un câmp conține secunde și celălalt conține microsecunde Primul câmp conține un cod care reprezintă numărul total de secunde care au trecut de la ianuarie (Acesta este punctul de referință standard pentru toate sistemele Unix ) Rețineți că al doilea argument pentru gettimeofday pe sistemele Linux ar trebui să fie pur și simplu NULL, deoarece Acest parametru se referă la o funcție neimplementată pentru corectarea citirilor de timp dintr-un fus orar Partea a II-a Executarea programelor în sistem REFERINŢA ?l La ce dată câmpul tv sec, a cărui valoare este determinată de funcția gettimeofday, devine negativ pe o mașină pe de biți? După cum se arată în Lista , putem folosi funcția gettimeofday pentru a crea o pereche de funcții start timer și get timer timer care sunt similare cu funcțiile de ceas pe care le folosim, dar diferă prin faptul că măsoară timpul în secunde, mai degrabă decât ciclurile de ceas ttinclude #include struct static timeval tstart; cinci /* scrie ora curentă */ void start timer() opt { gettimeofday(&tstart, NULL); } unsprezece /* returnează timpul în secunde de la ultimul apel to start timer */ dublu get timer() paisprezece { struct timeval tfinish; sec lung, usec; gettimeofday(&tfinish, NULL); sec = tfinish tv sec - tstart tv sec; usec = tfinish tv usec - tstart tv usec; ' return sec + le- *usec; } Aplicabilitatea acestui mecanism de măsurare depinde de modul în care este implementată funcția gettimeofday, iar această implementare variază de la sistem la sistem În timp ce faptul că funcția generează măsurători în microsecunde pare destul de promițător, se dovedește că aceste măsurători nu sunt întotdeauna atât de precise pe cât ne-am dori În tabel Figura prezintă rezultatul testării funcției în cauză pe mai multe sisteme diferite Definim rezoluția unei funcții ca fiind timpul minim pe care cronometrul îl poate distinge Am calculat-o apelând în mod repetat funcția gettimeofday până când valoarea dată de primul parametru se schimbă Deci rezoluția este numărul de microsecunde care a dus la acea modificare niste Capitolul Măsurarea timpului de execuție a programului Unele sisteme pot face distincția între cantitățile de timp cu precizie de microsecunde, în timp ce altele au o precizie mult mai mică Această discrepanță se datorează faptului că unele sisteme folosesc contoare de ceas oscilator pentru a implementa această funcție, în timp ce altele folosesc contorizarea intervalelor În primul caz, rezoluția poate fi foarte mare — potențial mai mare de µs, mai mare decât limita inferioară oferită de reprezentarea datelor În acest din urmă caz, rezoluția va fi scăzută - nu mai bună decât ceea ce poate fi furnizat de funcțiile de timp și ceas Tabelul Proprietăți de implementare a funcției Rezoluție sistem (µs) Întârziere (µs) Pentium I, Windows NT Compaq Alpha Pentium III Linux Sun UltraSparc În tabel Figura - arată, de asemenea, latența cauzată de apelarea funcției get timer pe diferite sisteme Această caracteristică înseamnă timpul minim necesar pentru apelarea funcției Am calculat această valoare apelând funcția specificată de mai multe ori timp de secundă și apoi împărțind la numărul de apeluri Este ușor de observat că este nevoie de aproximativ µs pentru a calcula funcția în majoritatea sistemelor Prin comparație, rutina noastră get counter durează doar aproximativ , µs per apel În general, apelurile de sistem sunt mai mari decât apelurile de funcții obișnuite Această întârziere limitează, de asemenea, acuratețea măsurătorilor noastre Chiar dacă structura datelor permite exprimarea timpului în unități de rezoluție mai mare, nu este clar cât de mult mai multă precizie am putea obține în măsurarea timpului atunci când fiecare măsurătoare introduce o întârziere atât de mare Pe fig Figura - arată eficiența performanței obținută prin implementarea schemei de măsurare K-best folosind funcția gettimeofday în loc de propria noastră funcție de contor de ceas Prezentăm aici rezultatele obținute pe două mașini diferite pentru a ilustra efectul rezoluției în timp asupra preciziei măsurătorii Măsurătorile pe un sistem Windows NT arată performanțe similare cu cele pe care le-am obținut pe un sistem Linux folosind funcția times (vezi Figura ) Deoarece funcția gettimeofday este implementată folosind cronometre de proces, eroarea poate fi negativă sau pozitivă și este foarte instabilă pentru măsurători de timp mici Precizia se îmbunătățește atunci când se măsoară intervale de timp mai lungi, de fapt, această eroare nu depășește , % când se măsoară intervale mai mari de ms Măsurătorile pe un sistem Linux dau rezultate similare cu cele observate la utilizarea directă a contoarelor Partea a II-a Executarea programelor în sistem cicluri Acest lucru este ușor de observat dacă comparăm măsurătorile pentru cazul de sarcină , prezentate, respectiv, în Fig (fără compensare) și în fig (cu compensare) Utilizând compensarea, putem obține o precizie mai bună de , %, chiar și atunci când se măsoară intervale de timp de ordinul a ms Astfel, gettimeofday acționează ca și cum ar avea acces direct la contorul de ceas de pe această mașină Orez Verificarea experimentală a corectitudinii schemei de măsurare Linux implementează această caracteristică folosind contoare de ceas și atinge aceeași precizie ca și propriile noastre rutine de sincronizare Windows NT implementează această caracteristică utilizând numărarea intervalelor și, prin urmare, precizia este slabă în acest caz, mai ales când se măsoară intervale scurte de timp Protocolul de experiment Acum putem rezuma rezultatele experimentelor noastre sub forma unui protocol pentru a răspunde la întrebarea: cât de repede rulează programul X pe mașina Y Capitolul Măsurarea timpului de execuție a programului □ Dacă timpul de execuție așteptat este mare (de exemplu, mai mult de , s), atunci numărul trebuie să funcționeze suficient de bine și să fie mai puțin sensibil la încărcarea procesorului □ Dacă timpul de execuție estimat este în intervalul de aproximativ , până la , s, atunci măsurătorile trebuie efectuate pe un sistem ușor încărcat și să utilizeze o măsurare precisă a timpului ținând cont de numărul de cicluri de ceas Ar trebui să testați funcția de bibliotecă gettimeofday pentru a determina dacă implementarea pe mașină numără tick-uri sau intervale: • dacă funcția numără ciclurile, atunci poate fi folosită ca funcție de bază pentru schema de măsurare K-best; • dacă funcția numără intervale, atunci ar trebui să găsiți o metodă potrivită care să folosească contorul de cicluri al oscilatorului principal al mașinii Acest lucru poate necesita scrierea unui program de asamblare □ Dacă timpul de execuție estimat este mai mic de aproximativ , s, atunci se pot face măsurători precise chiar și pe un sistem puternic încărcat, poate folosind măsurarea timpului prin numărarea ceasului Aceasta va implementa, de asemenea, o schemă de măsurare K-best utilizând fie funcția gettimeofday, fie acces direct la contorul de ceas al oscilatorului principal al mașinii O privire în viitor Există mai multe caracteristici inerente sistemelor care au un impact semnificativ asupra măsurării performanței □ Număr de ceas orientat spre proces Sistemul de operare poate manipula relativ ușor contorul de ceas al oscilatorului principal în așa fel încât numărul de ceasuri în timpul unui anumit proces este fix Pentru a face acest lucru, este pur și simplu necesar să stocați rezultatul numărării ca parte a stării procesului După ce procesul își reia activitatea, contorul de ceas va fi setat la valoarea pe care o avea când procesul a fost ultima dezactivat, de fapt, contorul de ceas este suspendat atâta timp cât procesul este inactiv Desigur, citirea contorului va fi în continuare afectată de „overhead” asociat cu operațiunile nucleului sistemului de operare și efectele memorării în cache, dar cel puțin alte procese nu vor avea un impact major Unele sisteme acceptă deja această caracteristică În cadrul protocolului pe care îl folosim, acest lucru ne va permite să măsurăm intervalele de timp folosind cicluri de ceas și, în același timp, să obținem valori precise ale intervalelor de timp care depășesc , s, chiar și pe sistemele puternic încărcate □ Ceas cu viteză variabilă Într-un efort de a reduce consumul de energie, sistemele moderne variază frecvența ceasului, deoarece consumul de energie este direct proporțional cu frecvența ceasului În acest caz, relația dintre impulsurile de ceas și nanosecunde devine destul de complexă Este greu de spus ce unități de măsură Partea a II-a Executarea programelor în sistem ar trebui folosit pentru a exprima eficiența execuției programului Pentru un optimizator de cod, este mai potrivit să numărați ciclurile de ceas, dar pentru alte aplicații, cum ar fi cele cu constrângeri în timp real, timpul real de execuție este mai important Implementarea schemei de măsurare K-best Am creat o funcție de bibliotecă fcyc care utilizează circuitul K-best pentru a măsura numărul de impulsuri de ceas necesare pentru funcția f: ttinclude „clock h” #include „fcyc h” typedef void (*test funct)(int *); double fcyc(test funct f, int *params); Parametrul params indică un număr întreg În general, poate indica o matrice de numere întregi care reprezintă parametrii funcției măsurate De exemplu, la măsurarea funcțiilor lowerl și lower , care convertesc caracterele unui șir dat în caractere minuscule, trecem ca parametru un pointer către un întreg scalar care este lungimea șirului de convertit Când construim un munte de memorie (vezi capitolul ), am putea trece un pointer către o matrice de două elemente care conține dimensiunea și pasul index Există o serie de parametri care controlează măsurarea, cum ar fi valorile K, r și L/, precum și o indicație dacă memoria cache ar trebui să fie șters înainte de fiecare măsurătoare Acești parametri pot fi setați prin funcții care pot fi găsite și în bibliotecă Sarcini pentru materialul acoperit În încercarea de a construi o schemă precisă de măsurare a timpului și de a evalua eficacitatea acestor scheme pe mai multe sisteme diferite, ne-am familiarizat cu unele dintre caracteristicile lor importante: □ Fiecare sistem are propriile sale caracteristici Diverse proprietăți, determinate de hardware-ul utilizat, sistemul de operare și implementarea funcțiilor bibliotecii, pot avea un impact semnificativ asupra tipurilor de programe care pot fi măsurate și cu ce precizie □ Un experiment poate spune multe Am beneficiat foarte mult de familiarizarea cu funcționarea programatorului sistemului de operare prin efectuarea de experimente simple pentru a genera urme ale activității procesului Acest lucru a dus la o schemă de compensare care îmbunătățește considerabil precizia pe un sistem Linux puțin încărcat Știind modul în care rezultatele pentru un sistem diferă de rezultatele pentru alt sistem și chiar pentru diferite versiuni ale nucleului aceluiași sistem de operare, este important să puteți analiza și înțelege corect multe aspecte ale funcționării sistemului care îi afectează performanța Capitolul Măsurarea timpului de execuție a programului □ Obținerea unor măsurători precise ale timpului pe sistemele puternic încărcate prezintă provocări suplimentare Majoritatea cercetătorilor de sistem fac toate măsurătorile pe sisteme de referință dedicate Ei rulează adesea sistemul pe mai multe sisteme de operare cu funcțiile de rețea blocate pentru a reduce impactul surselor de impact imprevizibile Din păcate, programatorii obișnuiți nu au acest lux Ei trebuie să partajeze sistemul cu alți utilizatori Chiar și pe sistemele puternic încărcate, circuitul nostru K-best este suficient de robust pentru a măsura timpi mai scurti decât intervalul temporizatorului □ Proiectarea experimentului ar trebui să poată controla unele dintre sursele de instabilitate în măsurarea performanței Efectele memorării în cache pot afecta foarte mult timpul de execuție a unui program Practica obișnuită este că memoria cache trebuie să fie eliberată de orice date calculabile înainte de a începe cronometrarea sau încărcată în alt mod cu unele date care ar trebui să fie în mod normal în memoria cache în starea sa inițială rezumat Acest capitol a început cu o întrebare aparent simplă: cât de repede rulează programul X pe mașina Y Din păcate, mecanismele utilizate de sistemele informatice pentru a rula mai multe procese în același timp fac dificilă obținerea unor măsurători fiabile ale eficienței execuției programului Acțiunile sistemului de operare se dezvoltă de fapt în spațiul a două scale de timp diferite La nivel micro, comenzile individuale sunt executate uneori măsurate în nanosecunde La nivel macro, operațiunile I/O sunt efectuate cu întârzieri măsurate în milisecunde Sistemele computerizate compensează această diferență prin trecerea continuă de la o sarcină la alta, pierzând de fiecare dată câteva milisecunde Există în esență două metode diferite de înregistrare a trecerii timpului în sistemele informatice Întreruperile temporizatorului apar într-un ritm care pare foarte rapid dacă evenimentele sunt vizualizate la nivel macro, dar foarte lent dacă evenimentele sunt vizualizate la nivel micro Numărând intervalele, sistemul poate folosi o măsură foarte grosieră a timpului de execuție a programului Această metodă este potrivită numai pentru măsurarea pe termen lung (cel puțin o secundă) Contoarele de ceas ale oscilatorului principal au o viteză mare, ceea ce oferă o precizie bună de măsurare la nivel micro Pentru contoarele de ceas oscilator care măsoară timpul absolut, o comutare de context poate provoca o eroare variind de la o mică inexactitate (pe un sistem puțin încărcat) la o eroare foarte mare (pe un sistem puternic încărcat) Astfel, schemele ideale nu există Este important să înțelegeți ce precizie poate fi atinsă pe fiecare dintre sisteme Efectele memorării în cache și predicției de ramuri condiționate pot duce la faptul că timpul necesar pentru a executa o anumită bucată de program Partea a II-a Executarea programelor în sistem codul se modifică de la o rulare la alta, în funcție de istoricul accesărilor la memorie și a salturilor condiționate Putem controla parțial această sursă de ambiguitate prin pre-executarea unui cod care va pune memoria cache într-o stare pre-aranjată, dar aceste încercări pot eșua în condițiile comutărilor de context Astfel, trebuie să facem mai multe măsurători și apoi să analizăm rezultatele înainte de a determina timpul real de execuție Din fericire, toate sursele de ambiguitate determină o creștere a timpului de execuție, astfel încât analiza se reduce la a determina dacă numărul minim de dimensiuni este o valoare exactă Printr-o serie de experimente, am reușit să dezvoltăm și să validăm schema de măsurare a timpului K-best, în care se face o secvență de măsurători repetate până când cei mai rapidi K se încadrează într-o anumită regiune în care sunt suficient de aproape unul de celălalt Pe unele sisteme, putem efectua măsurători folosind funcții de bibliotecă care returnează ora din zi În alte sisteme, trebuie să accesăm contoarele de ceas ale oscilatorului principal prin codul de asamblare Note bibliografice Surprinzător de puțină literatură a fost publicată despre măsurarea timpului de execuție al programelor Cartea lui Stevens [ ] documentează toate funcțiile bibliotecii pentru măsurarea timpului de execuție a programului Cartea lui Wadleigh și Crawford despre optimizarea programelor [ ] descrie cum să obțineți statistici privind utilizarea codului programului și descrie funcțiile de sincronizare standard Sarcini pentru soluție acasă EXERCIȚIUL ♦ ♦ Răspundeți la „Întrebare/Contact*niiiye” folosind următorul din Lista Programul nostru a estimat viteza de ceas la , MHz Apoi a calculat numărul de milisecunde de timp măsurat în urmă din tick-urile numărate Adică, timpul exprimat în ticks ca s , software-ul convertit în milisecunde utilizând formula s/ Din păcate, metoda software pentru calcularea frecvenței ceasului nu este perfectă și, prin urmare, unele măsurători ale timpului în milisecunde nu sunt complet exacte Intervalul temporizatorului pentru acest aparat este de ms Care dintre aceste perioade de timp au fost inițiate de o întrerupere a temporizatorului? Pe baza acestei urme, răspundeți la întrebarea care este numărul minim de impulsuri de ceas necesare sistemului de operare pentru a deservi o întrerupere a temporizatorului Pe baza datelor de urmărire și presupunând că intervalul cronometrului este exact , ms, care este valoarea adevărată a frecvenței de ceas Capitolul Măsurarea timpului de execuție a programului EXERCIȚII ♦ ♦ Scrieți un program care să folosească funcțiile de bibliotecă de timp și somn pentru a aproxima numărul de bifături pe secundă al ceasului sistemului Încercați să compilați acest program și să îl rulați pe mai multe sisteme Încercați să găsiți două sisteme diferite care produc rezultate care diferă cu cel puțin un factor de doi EXERCIȚIUL ♦ Pentru a genera o urmă de activitate, putem folosi un generator de ceas, cum ar fi cele din Listele și Utilizați funcțiile start counter și get counter pentru a scrie o funcție ca aceasta: #include „clock h” int inactiveduration(int thresh); Această funcție verifică continuu contorul ceasului și detectează când două citiri succesive diferă cu mai mult de un ciclu de ceas, indicând faptul că procesul a fost inactiv Funcția returnează durata (în bifă) a acestei perioade de timp inactive EXERCIȚIUL ♦ Să presupunem că numim funcția mhz (vezi Lista ) cu sleeptime = Temporizatorul de sistem are un interval de ms Să presupunem că funcția de somn este implementată după cum urmează Procesorul menține un numărător care crește cu unu de fiecare dată când apare o întrerupere a temporizatorului Când sistemul execută sleep(x), programează rularea unui proces, care va fi repornit când valoarea contorului atinge t + x, unde t este valoarea curentă a contorului Notați cu w intervalul de timp în care procesul nostru este inactiv din cauza unui apel la funcția sleep Dacă ignorăm diferitele cheltuieli generale datorate apelurilor de funcții, întreruperilor temporizatorului etc , atunci care ar putea fi răspândirea valorilor vv? Să presupunem că apelul funcției mhz returnează , Și din nou, ignorând diferitele cheltuieli generale ale resurselor, care este posibila răspândire a frecvenței de ceas adevărată? Soluție de exercițiu SOLUȚIE ȘI EXERCIȚII La prima vedere, pare imposibil să întrerupi CPU și să executi de cicluri doar pentru a procesa o singură apăsare a tastei Cu toate acestea, sarcina completă a procesorului central va fi foarte mică Partea a II-a Executarea programelor în sistem de cuvinte pe minut corespund la apăsări de taste pe secundă Numărul total de cicluri utilizate pe secundă de aceste de clicuri va fi x x = , adică % din numărul total de cicluri procesor SOLUȚIE ȘI EXERCIȚII Această sarcină necesită un studiu atent al urmăririi și predicției tipului de model de implementare Evenimentele apar la intervale de , – , ms: , , , , , , , , , , , , , , , Observați punctele care au fost determinate prin adăugarea , la punctul anterior în timp Acești timpi încep fiecare nou interval al stării pasive Intervalele de timp inactive constau din intervalele de timp petrecute pentru deservirea a două întreruperi și timpul în care se executa un alt proces Procesul nostru este activ pentru aproximativ , ms din fiecare ms, adică , % din timp EXERCIȚII DE SOLUȚIE Această sarcină este pur și simplu marcarea secvenței de execuție a unui proces și determinarea dacă procesul este în modul utilizator sau în modul privilegiat (Figura ) Au Au As Bu Bu Bu Bu Bs Bu As Au Au Au Au Bs Bu Bu Bu Bs Au As Au Au Au As A u + s B u + s LA LA ȘI Orez Marcarea secvenței SOLUȚIA EXERCITULUI Aceasta este o sarcină interesantă pentru ingeniozitate Vă va face să vă gândiți la intervalul de valori posibile care ar putea avea ca rezultat un anumit număr de intervale Următorul desen prezintă două astfel de cazuri (Fig ): Minim Maxim Orez Interval de valori Pentru cazul etichetat „minim”, startul a avut loc chiar înainte de întrerupere la momentul și execuția s-a încheiat imediat după întrerupere la momentul , dând puțin peste ms Pentru cazul „maximum”, lansarea Capitolul Măsurarea timpului de execuție a programului a avut loc imediat după întrerupere la momentul , iar execuția a continuat până la momentul imediat precedent marcajului de timp , dând un timp total de puțin sub ms EXERCIȚII DE SOLUȚIE Această sarcină necesită să vă gândiți la cât de bine funcționează schema de numărare Aceste șapte întreruperi ale temporizatorului apar în timp ce procesul este activ, așa că ați crede că timpul utilizatorului va fi de ms și cel al sistemului de ms În urma reală, procesul a rulat timp de , ms în modul utilizator și , ms în modul privilegiat Contorul a supraestimat timpul real de execuție cu un factor de / ( , + , ) = , SOLUȚIA Această sarcină necesită să ne gândim la diferitele surse de întârziere în programe și la condițiile în care apar aceste surse Conform rezultatelor măsurătorilor, obținem: c + m + p + d = ; c + d = ± ; c + p = Din aceasta concluzionăm că c = , d ~ , p = și m = SOLUȚIE/ EXERCIȚIU Această sarcină necesită apelul la un model probabilist de planificare a procesului simplu Acesta arată că obținerea de măsurători precise devine dificilă pe măsură ce timpul se apropie de limita pentru un anumit proces Pentru t probabilitatea este Pentru t > , nu vom obține un singur test care să fie efectuat într-un cuantum de timp al procesului Pentru t / și, prin urmare, ne putem aștepta la /p = /( -/) încercări Pentru / = , ne așteptăm să obținem încercări, în timp ce pentru /= ne așteptăm la EXERCIȚII DE SOLUȚIE Aceasta este versiunea Unix a problemei Y K Unii au prezis un dezastru general atunci când acul ceasului și-a încheiat ultima revoluție Ca și în cazul anului , credem că aceste preocupări sunt nefondate Acest lucru se va întâmpla la de secunde după ianuarie Afișajul va afișa ianuarie , ora : CAPITOLUL Memorie virtuala □ Adresare fizică și virtuală □ Spații de adrese □ Memoria virtuală ca mijloc de stocare în cache □ Instrument de manipulare a memoriei □ Memoria virtuală ca mijloc de protecție a memoriei □ Conversia adresei □ Sistem de memorie Pentium/Linux □ Afișare memorie □ Alocarea dinamică a memoriei □ Colectarea gunoiului □ Greșeli frecvente □ Rezumatul unor concepte cheie legate de memoria virtuală □ Reluați Procesele din sistem partajează CPU (unitatea centrală de procesare) și RAM cu alte procese Cu toate acestea, partajarea memoriei RAM între procese creează unele probleme specifice Pe măsură ce cererile pentru resursa CPU cresc, viteza de execuție a proceselor scade treptat Dar dacă prea multe procese necesită prea mult spațiu de memorie, atunci unele dintre ele pur și simplu nu vor putea rula Dacă programul epuizează spațiul de memorie alocat, atunci acest lucru poate duce la consecințe catastrofale Informațiile din memorie sunt supuse distorsiunii Dacă un proces își scrie din neatenție datele în memoria folosită de un alt proces, atunci execuția acelui proces poate eșua în cel mai de neînțeles mod, complet fără legătură cu logica programului Partea a II-a Executarea programelor în sistem Pentru a gestiona memoria mai eficient și cu cât mai puține erori posibil, sistemele moderne folosesc o abstractizare a memoriei principale cunoscută sub numele de memorie virtuală (VM) Memoria virtuală este o compoziție elegantă de excepții la nivel hardware care interacționează, traducerea adresei; RAM, fișiere de disc și programe kernel de sistem care oferă fiecărui proces un spațiu de adrese mare, uniform și privat Printr-un mecanism bine conceput, memoria virtuală oferă trei proprietăți importante: □ folosește eficient memoria principală, tratând-o ca cache pentru spațiul de adrese stocat pe disc, lăsând doar zonele utilizate activ în memoria principală și trecând date înainte și înapoi între disc și memorie după cum este necesar; □ simplifică gestionarea memoriei prin asigurarea fiecărui proces cu un spațiu de adrese uniform; □ protejează spațiul de adrese al fiecărui proces împotriva distrugerii de către alte procese Memoria virtuală este una dintre marile idei implementate în sistemele informatice Principalul motiv al succesului său este că funcționează automat și fără nicio intervenție din partea programatorului aplicației Și dacă memoria virtuală funcționează atât de bine în umbră, atunci de ce ar trebui un programator să-i înțeleagă designul? Există mai multe motive pentru aceasta □ Memoria virtuală este în centrul lucrurilor Memoria virtuală pătrunde pe toate nivelurile sistemelor informatice, jucând un rol cheie în schema de excepție hardware, în funcționarea asamblatorilor, a legăturilor și a legăturilor, a încărcătoarelor și în partajarea obiectelor, fișierelor și proceselor Cunoașterea modului în care funcționează memoria virtuală vă va ajuta să înțelegeți mai bine cum funcționează astfel de sisteme în general □ Memoria virtuală are un mare potențial Memoria virtuală oferă aplicațiilor oportunități ample de a crea și distruge bucăți de memorie, de a mapa bucăți de memorie la secțiuni de fișiere de pe disc și de a partaja memorie prin mai multe procese De exemplu, știați că puteți citi sau modifica conținutul unui fișier de pe disc citind și scriind într-o regiune a memoriei? Sau că puteți încărca conținutul unui fișier în memorie fără a face nicio copiere explicită? Înțelegerea modului în care funcționează memoria virtuală vă va ajuta să folosiți capabilitățile sale puternice în aplicațiile dvs □ Memoria virtuală este periculoasă Aplicațiile interacționează cu memoria virtuală ori de câte ori întâlnesc o referință variabilă, o dereferință de pointer sau o solicitare către unul dintre pachetele software de alocare dinamică a memoriei, cum ar fi pachetul mal loc Dacă memoria virtuală nu este utilizată corespunzător, aplicațiile se pot bloca din cauza unor erori de memorie sofisticate, inexplicabile De exemplu, un program cu un pointer invalid poate termina imediat execuția cu un diagnostic de „eroare de segmentare” sau „eroare de protecție” Capitolul Memoria virtuală memorie”, dar poate rula silențios multe ore înainte de a se prăbuși sau, cel mai rău, de a-și finaliza execuția normal, dar cu rezultate incorecte Cunoașterea elementelor de bază ale memoriei virtuale și ale mecanismelor de alocare a memoriei, cum ar fi pachetul malloc, vă poate ajuta să evitați astfel de greșeli Acest capitol discută memoria virtuală din două perspective În prima jumătate a capitolului, vom arăta cum funcționează memoria virtuală În a doua jumătate, vom descrie modul în care aplicațiile folosesc memoria virtuală și cum o gestionează Nu putem ignora faptul că VM este un mecanism complex și vom ține cont de acest fapt pe tot parcursul discuției Partea pozitivă a acestei abordări este că cunoașterea detaliilor acestui mecanism te va ajuta să modelezi singur mecanismul de memorie virtuală al unui sistem mic, iar ideea de memorie virtuală își va pierde pentru totdeauna aura mistică pentru tine În a doua parte a capitolului, presupunând că cititorul are o bună înțelegere a conceptelor de bază, vă vom arăta cum să utilizați și să gestionați memoria virtuală în programele dumneavoastră Veți învăța cum să gestionați memoria virtuală folosind maparea explicită a memoriei și apelurile la instrumente software de alocare dinamică a memoriei, cum ar fi malloc De asemenea, veți întâlni o mulțime de erori de utilizare greșită a memoriei în programele C și veți învăța cum să le evitați Adresare fizică și virtuală Memoria RAM a unui sistem informatic este organizată ca o matrice de celule aranjate secvenţial cu o dimensiune de un octet Fiecare octet are o adresă fizică unică (PA, Adresă fizică) Primul octet este adresa , următorul octet este adresa , următorul octet este adresa și așa mai departe Cu această organizare simplă a memoriei, cea mai naturală modalitate prin care CPU poate accesa memoria este prin adresele fizice Numim această abordare adresare fizică Pe fig Figura prezintă un exemplu de adresare fizică în contextul unei comenzi de încărcare care citește cuvântul care începe cu adresa fizică Când unitatea centrală de procesare (CPU) execută o comandă de încărcare, generează o adresă fizică efectivă și o transferă în memoria principală de pe magistrala de memorie RAM preia un cuvânt de patru octeți începând cu adresa fizică și returnează acel cuvânt CPU-ului, care îl stochează într-un registru Cele mai vechi PC-uri au folosit adresare fizică, iar sisteme precum procesoarele de semnal digital, microcontrolerele încorporate și supercalculatoarele Cray continuă să folosească acest tip de adresare Cu toate acestea, procesoarele moderne concepute pentru calcularea de uz general utilizează o formă de adresare cunoscută sub numele de Adresare virtuală (VA) (Figura ) Folosind adresarea virtuală, CPU accesează memoria RAM, generând o adresă virtuală, care este convertită în Partea a II-a Executarea programelor în sistem adresa fizică corespunzătoare înainte de accesarea memoriei Sarcina de a converti o adresă virtuală într-o adresă fizică este cunoscută sub numele de traducere de adrese sau traducere de adrese La fel ca gestionarea excepțiilor, traducerea adreselor necesită o cooperare strânsă între hardware-ul CPU și sistemul de operare Hardware specializat de pe placa procesorului numit Memory Management Unit (MMU) traduce adresele virtuale în adrese fizice pe parcurs, folosind un tabel de traducere stocat în RAM, care este gestionat de sistemul de operare Memorie Cuvânt de date Orez Sistem care utilizează adresarea fizică Memorie chip CPU Cuvânt de date Orez Sistem care utilizează adresarea virtuală Spațiu de adrese Spațiul de adrese este un set ordonat de adrese întregi nenegative { , , , } Dacă valorile întregi ale unui spațiu de adrese sunt ordonate liniar, atunci spunem că este un spațiu de adrese liniar Capitolul Memoria virtuală (spațiu de adrese liniar) Pentru a simplifica discuția noastră, vom presupune întotdeauna că spațiile de adrese liniare sunt întotdeauna utilizate Într-un sistem de memorie virtuală, CPU generează adrese virtuale dintr-un spațiu de adrese de N = " numit spațiu de adrese virtuale { , , , , Y- } Mărimea spațiului de adrese este determinată de numărul de biți binari necesari pentru a reprezenta cea mai mare adresă De exemplu, un spațiu de adrese virtuale cu adrese N = " se numește spațiu de adrese de w-biți Sistemele moderne acceptă de obicei spații de adrese virtuale de de biți sau de biți Sistemul are, de asemenea, un spațiu de adrese fizice, care corespunde la L/octeți de memorie fizică în sistem { , , , , M- } M nu trebuie să fie o putere a doi, dar pentru simplitate vom presupune că M = m Importanța conceptului de spațiu de adrese vine din faptul că face o distincție clară între obiectele de date (octeți) și atributele acestora (adresele) Odată ce recunoaștem această distincție, putem generaliza și permite fiecărui obiect de date să aibă mai multe adrese independente, fiecare aleasă din propriul spațiu de adrese Aceasta este ideea de bază a memoriei virtuale Fiecărui octet de RAM i se atribuie o adresă virtuală din spațiul de adrese virtuale și o adresă fizică selectată din spațiul de adrese fizice EXERCIȚIUL Completați tabelul de mai jos completând spațiile libere și înlocuiți fiecare semn de întrebare cu numărul întreg corespunzător Utilizați următoarele unități: K = (Kilo), M = (Mega), G = (Giga), T = (Tera), P = (Peta) sau E = (Exa) Număr de biți de adresă virtuală Număr de adrese virtuale Adresă virtuală maximă posibilă opt ? = K - = ?G - ? = T instrument de stocare în cache Din punct de vedere conceptual, memoria virtuală este organizată ca o matrice de N celule de octet aranjate secvenţial stocate pe disc Fiecare octet are un uni Partea a II-a Executarea programelor în sistem O adresă virtuală virtuală care servește ca index în această matrice Conținutul matricei de pe disc este stocat în cache în RAM Ca și în cazul oricărui alt cache din ierarhia memoriei, datele de pe disc (nivel inferior) sunt împărțite în blocuri care servesc ca unități de schimb între disc și RAM (nivel superior) Sistemele VM le manipulează prin împărțirea memoriei virtuale în blocuri de dimensiuni fixe numite pagini virtuale (VR, Pagini virtuale) Fiecare pagină virtuală are o dimensiune de P = P octeți În mod similar, memoria fizică este împărțită în pagini fizice (PP, Physical Pages), tot de dimensiunea P octeți Paginile fizice sunt numite și cadre de pagină În orice moment, setul de pagini virtuale este împărțit în trei subseturi care nu se suprapun: □ pagini inactive care nu au fost încă alocate (sau create) de sistemul de memorie virtuală Blocurile inactive nu conțin date și, prin urmare, nu ocupă spațiu pe disc; □ pagini stocate în cache care sunt în prezent stocate în memoria fizică; □ Uncached - Paginile distribuite nu sunt momentan memorate în cache în memoria fizică În exemplul prezentat în fig , este afișată memoria virtuală, constând din pagini virtuale Paginile virtuale și nu au fost încă alocate, nu există pe disc Paginile virtuale , și sunt stocate în cache în memoria fizică Paginile , și sunt alocate, dar nu sunt stocate în memoria cache în RAM Memorie virtuală VPO VP memorie fizică VR P'R- PPO RR RR t-₽- Pagini virtuale salvate pe disc Paginile fizice stocate în cache în DRAM Orez Cum folosește sistemul VM RAM ca cache Organizarea cache-ului în DRAM Pentru a face mai ușoară referirea la diferite cache-uri din ierarhia memoriei, vom folosi termenul cache SRAM (Static Random Access Memory) pentru a ne referi la primul (L ) și al doilea (L ) cache dintre CPU și RAM ter Capitolul Memoria virtuală min Cache DRAM (Dynamic Random Access Memory, Dynamic Random Access Memory) pentru a se referi la memoria cache a sistemului VM pentru paginile virtuale din memoria principală Locul ocupat de DRAM în ierarhia memoriei este de o importanță decisivă în alegerea modului în care este organizată Amintiți-vă din nou că DRAM este de aproximativ ori mai lent decât SRAM și că un disc este de aproximativ de ori mai lent decât DRAM Astfel, eșecurile de acces la DRAM sunt foarte costisitoare (din punct de vedere al timpului) în comparație cu eșecurile SRAM, deoarece accesele DRAM necesită acces la disc, în timp ce accesele SRAM necesită de obicei acces la RAM construită pe baza DRAM Mai mult, citirea primului octet dintr-un sector de disc este de aproximativ de ori mai lentă decât citirea octeților următori ai sectorului Dorința de a reduce acest tip de costuri a fost motivul organizării DRAM-ului Datorită supraîncărcării mari din cauza lipsei de pagini și a timpului lung de acces la primul octet, există tendința de a face paginile virtuale mari, de obicei dimensiunile lor sunt alese în intervalul de la patru până la opt kilobytes Datorită supraîncărcării mari asociate cu lipsa paginii necesare, DRAM-urile sunt făcute complet asociative, adică orice pagină virtuală poate fi plasată într-o pagină fizică Strategia de înlocuire atunci când o pagină lipsește este, de asemenea, importantă, deoarece costul general asociat cu înlocuirea unei pagini virtuale lipsă este prea mare În consecință, sistemele de operare folosesc algoritmi de înlocuire mult mai sofisticați pentru DRAM decât algoritmul hardware pentru SRAM (Algoritmii de substituție sunt în afara domeniului nostru de aplicare ) În cele din urmă, din cauza timpilor lungi de acces la disc, DRAM-urile folosesc întotdeauna un algoritm de scriere înapoi, mai degrabă decât un algoritm de scriere, atunci când datele sunt scrise în cache și RAM în același timp Tabelele de pagini Ca și în cazul oricărui cache, sistemul de memorie virtuală trebuie să poată determina dacă o pagină virtuală este stocată în cache în DRAM Dacă da, atunci sistemul trebuie să determine în ce pagină fizică este stocat în cache Dacă lipsește pagina dorită, sistemul trebuie să determine unde pe disc este stocată această pagină virtuală, să selecteze o pagină din memoria fizică care poate fi ștearsă și să copieze pagina virtuală de pe disc în DRAM în locul paginii șterse Aceste capabilități sunt furnizate de o combinație de software de sistem de operare, hardware de traducere a adresei MMU (unitate de gestionare a memoriei) și o structură de date stocată în memoria fizică cunoscută sub numele de tabel de pagini care mapează paginile virtuale cu paginile fizice Hardware-ul de traducere a adreselor accesează tabelul de pagini de fiecare dată când trebuie să traducă o adresă virtuală într-o adresă fizică Partea a II-a Executarea programelor în sistem adresa cerului Sistemul de operare este responsabil pentru menținerea conținutului tabelului de pagini și pentru transferul paginilor în ambele direcții între disc și DRAM Orez Figura ilustrează principiile de bază ale construirii unui tabel de pagini Tabelul de pagini este o matrice de elemente de tabel de pagini (PTE, Page Table Entry) Fiecare pagină din spațiul de adrese virtuale are propriul său element PTE, al cărui offset în tabelul de pagini este fix Pentru scopurile noastre, să presupunem că fiecare PTE constă dintr-un bit valid și un câmp de adresă ^-bit Bitul de valabilitate indică dacă pagina virtuală dată este în prezent stocată în cache în DRAM Dacă bitul de valabilitate este setat (adică, egal cu ), atunci câmpul de adresă indică începutul paginii fizice corespunzătoare din DRAM în care pagina virtuală este stocată în cache Dacă bitul de valabilitate nu este setat (adică, egal cu ), atunci adresa zero indică faptul că pagina virtuală nu a fost încă atribuită nici unei pagini fizice În caz contrar, adresa indică începutul unei pagini virtuale pe disc VP I Orez Tabelul paginii În exemplul din fig Figura prezintă tabelul de pagini pentru un sistem cu pagini virtuale și pagini fizice Patru pagini virtuale (VR , VR , VR și VR ) sunt stocate în cache în DRAM la un moment dat Două pagini (VP și VP ) nu au fost încă alocate, iar restul (VP și VP ) sunt găzduite și nu sunt stocate în cache Este important de reținut aici că, deoarece DRAM este complet asociativă, orice pagină fizică poate conține orice pagină virtuală IMPORTANT nouăsprezece:? Determinați numărul de intrări din tabelul de pagini PTE necesare pentru următoarele combinații de lățime a adresei virtuale n și dimensiunea paginii P: Capitolul Memoria virtuală și P = '' Număr de PTE-uri K K K K Pagina este în DRAM Luați în considerare ce se întâmplă atunci când CPU citește un cuvânt dintr-o pagină de memorie virtuală conținută în VP care este stocată în cache în DRAM (Figura ) În conformitate cu metodologia, pe care o vom descrie în detaliu în Sect , hardware-ul de traducere a adresei folosește adresa virtuală ca index pentru a localiza PTE și a citi cuvântul din memorie Deoarece bitul de validitate este setat la , hardware-ul de traducere a adresei știe că pagina VP este stocată în cache în memorie Prin urmare, pentru a obține adresa fizică a unui cuvânt, CPU va folosi adresa de memorie fizică din PTE (care indică începutul paginii stocate în cache în PP ) Orez Pagina VM este în DRAM Adresarea unei pagini lipsă În ceea ce privește memoria virtuală, absența paginii necesare în DRAM se numește o eroare de pagină Pe fig Figura - arată starea tabelului de pagini folosit în exemplul nostru înainte ca acest tip de eșec să apară CPU s-a referit la un cuvânt de pe pagina VP care Partea a II-a Executarea programelor în sistem nu este stocat în cache în DRAM Hardware-ul modulului de traducere a adresei încearcă să citească PTE din memorie, dar bitul de validitate concluzionează că VP nu este stocat în cache și aruncă o excepție din cauza paginii lipsă Orez Eroare din cauza lipsei paginii de memorie virtuală (înainte de blocare) O excepție de pagină lipsă apelează un handler de excepție din nucleu care selectează pagina de ștears, în acest caz pagina VP stocată în PP Dacă VP a fost modificat, nucleul o copie înapoi pe disc În ambele cazuri, nucleul ajustează intrarea tabelului de pagini VP pentru a reflecta faptul că VP nu mai este stocat în cache în memoria principală Nucleul copiază apoi VP de pe disc în memoria lui PP , modifică PTE și apoi revine La întoarcerea de la handler, instrucțiunea eșuată este repornită, care trimite din nou adresa virtuală eșuată către hardware-ul de traducere a adresei Dar acum VP este deja memorat în cache în RAM, iar pagina căutată va fi procesată de hardware-ul de traducere a adresei în mod obișnuit, așa cum am văzut în Figura Pe fig Figura - arată starea tabelului nostru de pagini exemplu după ce pagina lipsă a fost accesată Mecanismele de memorie virtuală au fost inventate la începutul anilor , cu mult înainte ca decalajul tot mai mare dintre RAM și CPU să fie acoperit cu SRAM Ca urmare, sistemele de memorie virtuală folosesc o terminologie care diferă de terminologia SRAM, chiar dacă aceleași idei sunt folosite în ambele cazuri În terminologia limbajului de memorie virtuală, blocurile sunt numite pagini Acțiunea de a muta pagini între disc și memorie se numește schimbare sau paginare Paginile sunt încărcate (schimbate, paginate) de pe disc în DRAM și descărcate (schimbate, paginate) din Capitolul Memoria virtuală DRAM pe disc Strategia de a aștepta încărcarea unei pagini până în ultimul moment în care o pagină eșuează se numește paginare la cerere Sunt posibile și alte abordări, cum ar fi încercarea de a prezice absența unei pagini și preluarea prealabilă a paginii înainte de a face link-ul efectiv la ea Cu toate acestea, toate sistemele moderne folosesc înlocuirea paginilor la cerere VP Orez Eroare din cauza lipsei paginii de memorie virtuală necesară (după blocare) Aranjament în pagină Pe fig Figura - arată modificările din tabelul nostru de pagini exemplu atunci când sistemul de operare alocă o nouă pagină de memorie virtuală, de exemplu, ca urmare a unui apel malloc În acest exemplu, un spațiu pe disc a fost alocat pentru pagina VP , iar PTE a fost modificat pentru a indica pagina nou creată pe disc Nucleul plasează pagina VP pe disc și setează valoarea PTE la noua sa locație în memorie (pe disc) Din nou despre compactitatea plasării Pentru mulți dintre noi, atunci când aflăm despre ideile din spatele memoriei virtuale, prima impresie este adesea că aceste mecanisme trebuie să fie extrem de ineficiente Cu o suprasarcină atât de mare a resurselor cauzată de o pagină lipsă, ne temem că paginarea va anula eficiența execuției programului Cu toate acestea, în practică, memoria virtuală funcționează destul de bine, în principal datorită vechii noastre localități familiare Partea a II-a Executarea programelor în sistem Pagina fizică a unui disc RTE O RTE Pagina rezidentă a tabelului (DRAM) Memorie fizică (DRAM) VRT VR VR VR PPO RRZ Memorie virtuală (disc) VR ~| VP | VRZ VP | VP | VP | VR ~~| Orez Găzduirea unei noi pagini virtuale Deși numărul total de pagini diferite la care se referă programe pe parcursul întregii perioade de execuție poate depăși întreaga cantitate de memorie fizică, cu toate acestea, principiul alocării compacte sugerează că în orice moment vor funcționa cu un set mai mic de pagini active (active pagina), numit set de lucru (set de lucru) sau set rezident (set rezident) de pagini După costul inițial al plasării setului de lucru în memorie, obiectele de referință ulterioare sunt în setul de lucru și nu vor fi însoțite de un schimb suplimentar de disc Atâta timp cât programele noastre sunt amplasate compact în memorie, sistemul de memorie virtuală funcționează fără probleme În același timp, nu orice program poate fi plasat în mod optim în memorie Dacă dimensiunea setului de lucru este mai mare decât memoria fizică, atunci programul poate duce la o situație nedorită numită thrashing, în care paginile sunt pompate continuu de pe disc în memorie și înapoi De obicei, memoria virtuală funcționează eficient, dar dacă viteza de execuție a programului scade considerabil, un programator experimentat va suspecta imediat că este posibilă distrugerea memoriei Numărul de accesări la pagina lipsă Puteți urmări de câte ori o pagină lipsă a fost accesată (și puteți obține o mulțime de alte informații utile) folosind funcția Unix getrusage Manipularea memoriei În ultima secțiune, am văzut cum memoria virtuală oferă mecanisme care permit utilizarea DRAM-ului pentru a stoca în cache paginile, de obicei dintr-un spațiu de adrese virtuale mult mai mare Interesant, unii Capitolul Memoria virtuală Unele sisteme timpurii, cum ar fi PDP- / de la DEC, suportau un spațiu de adrese virtuale mai mic decât toată memoria fizică Cu toate acestea, memoria virtuală a fost, de asemenea, un mecanism util în acest caz, simplificând foarte mult gestionarea memoriei și oferind o modalitate naturală de protejare a memoriei Până acum, am presupus existența unui singur tabel de pagină care mapează un singur spațiu de adrese virtuale cu un spațiu de adrese fizice De fapt, sistemele de operare oferă fiecărui proces un tabel de pagini separat și, prin urmare, un spațiu de adrese virtual separat Orez ilustrează ideea de bază a acestui mecanism În exemplul nostru, tabelul de pagini pentru proces / mapează VP la PP și VP la PP În mod similar, tabelul de pagini pentru procesul J mapează VP la PP și VP la PP Rețineți că mai multe pagini virtuale poate fi mapat la aceeași pagină fizică partajată memorie fizică Orez Cum memoria virtuală oferă spații de adrese separate pentru diferite procese Combinația de înlocuire a paginii la cerere cu spații de adrese virtuale separate are un efect profund asupra modului în care memoria este utilizată și gestionată într-un sistem În special, memoria virtuală facilitează conectarea și încărcarea, partajarea codului și datelor și alocarea memoriei aplicațiilor Simplificarea aspectului Un spațiu de adresă privată permite fiecărui proces să utilizeze același format de bază pentru imaginea sa de memorie, indiferent unde codurile programului și datele se află în prezent în memoria fizică De exemplu, fiecare proces Linux utilizează formatul prezentat în Fig O secțiune de text începe întotdeauna la adresa virtuală x , stiva crește întotdeauna în jos de la adresa xbfffffff, codul bibliotecii partajate începe întotdeauna la x și codul sistemului de operare Partea a II-a Executarea programelor în sistem noi și datele încep întotdeauna la ohsooooooo Această ordonare rigidă simplifică foarte mult dezvoltarea și implementarea linkerelor, permițându-vă să obțineți executabile complet legate, independent de locul în care se află codul programului și datele din zona de memorie fizică OHSOOOOOOOOO invizibil pentru utilizator cod x Stivă personalizată (în timpul rulării) %esp (indicator de stivă) Zona de memorie pentru biblioteci partajate brk unu memorie dinamică (malloc) x Segment de citire și scriere ( data, bss) Segment de numai citire ( init, text, rodata) k Încărcat din executabil despre Nefolosit Orez Imagine de memorie a unui proces Linux Simplificați partajarea Spațiile de adrese separate oferă sistemului de operare un mecanism consistent pentru gestionarea partajării memoriei între procesele utilizatorului și sistemul de operare însuși În general, fiecare proces are propriul cod proprietar, date, heap-uri și zone de stivă care sunt utilizate exclusiv de acel proces Procedând astfel, sistemul de operare creează tabele de pagini care mapează paginile virtuale corespunzătoare cu paginile fizice care nu se suprapun În același timp, în unele cazuri este de dorit ca procesele să poată partaja anumite coduri de program și date Luați, de exemplu, cazul în care fiecare proces trebuie să apeleze același cod de nucleu al sistemului de operare și fiecare program C apelează subrutine din biblioteca standard C, cum ar fi programul printf În loc să includă copii separate ale nucleului și ale bibliotecii standard C în fiecare proces, sistemul de operare poate aranja ca mai multe procese să partajeze o singură copie a acestui cod prin maparea paginilor virtuale respective ale diferitelor procese la aceleași pagini fizice Capitolul Memoria virtuală Simplificarea alocării memoriei Memoria virtuală implementează un mecanism simplu pentru alocarea de memorie suplimentară proceselor utilizatorului Când un program care rulează într-un proces utilizator solicită spațiu suplimentar din „memoria dinamică” (de exemplu, ca urmare a unui apel malloc), sistemul de operare alocă numărul corespunzător, să spunem k, de pagini consecutive de memorie virtuală și le mapează la k pagini fizice arbitrare, situate oriunde în memoria fizică Datorită naturii tabelelor de pagini, nu este nevoie ca sistemul de operare să determine locația acestor pagini aranjate secvenţial de memorie fizică Paginile pot fi împrăștiate aleatoriu în memoria fizică Simplificați descărcarea Printre altele, memoria virtuală facilitează încărcarea fișierelor obiecte executabile și partajate în memorie Amintiți-vă că secțiunile text și data din executabilele ELF sunt secvențiale Pentru a încărca aceste partiții în procesul nou generat, bootloader-ul Linux alocă un set de pagini virtuale consecutive începând cu adresa x , le marchează ca nedemontabile (adică, nu pot fi stocate în cache) și scrie pointeri către zonele de memorie obiect corespunzătoare din pagina lor intrări în tabel fișier Interesant este faptul că bootloader-ul nu copiază niciodată nicio dată de pe disc în memorie Datele sunt plasate în pagini de către sistemul de memorie virtuală automat și la cerere cu fiecare referință la pagina corespunzătoare, la solicitarea CPU atunci când este selectată următoarea instrucțiune sau de o instrucțiune executabilă când se referă la o anumită zonă de memorie Acest concept de mapare a unui set de pagini virtuale consecutive la o locație arbitrară dintr-un fișier se numește mapare de memorie Sistemul de operare Unix implementează o comandă de apel de sistem numită mmap care permite programelor de aplicație să obțină propria lor mapare a memoriei Vom descrie maparea memoriei la nivel de aplicație mai detaliat în Sec VM ca protector de memorie Orice sistem informatic modern trebuie să aibă un mijloc prin care sistemul de operare ar putea controla accesul la sistemul de memorie Un proces de utilizator nu ar trebui să aibă voie să-și modifice secțiunea de text numai în citire De asemenea, nu poate fi permisă citirea sau modificarea niciunui cod de program și structuri de date ale nucleului de sistem Nu puteți permite citirea sau scrierea în memoria privată a altor procese și nici nu puteți permite modificări ale oricăror pagini virtuale care sunt partajate cu alte procese Partea a II-a Executarea programelor în sistem proceselor, până când toate părțile interesate sunt de acord în mod explicit cu acest lucru (prin apeluri de sistem explicite la funcții de interacțiune între procese) După cum am văzut, având spații de adrese virtuale separate, este mai ușoară izolarea zonelor de memorie privată ale diferitelor procese Dar mecanismul de traducere a adresei poate fi extins în mod natural pentru a oferi un control al accesului și mai fin Deoarece hardware-ul de traducere a adresei citește PTE-urile de fiecare dată când CPU-ul generează o adresă, controlează direct accesul la conținutul paginii virtuale, adăugând niște biți de permisiune suplimentari la PTE Orez ilustrează ideea generală din spatele acestei abordări Tabele de pagini cu biți de permisiuni VP : Procesul i: VP : VP : VP : Proces]: VP : VR : Orez Utilizarea memoriei virtuale pentru a oferi protecție la nivel de pagină În acest exemplu, am adăugat trei biți de control la fiecare element PTE Bitul SUP indică dacă procesul trebuie să ruleze în modul kernel (modul privilegiat) pentru a accesa pagina dată Procesele care rulează în modul privilegiat pot accesa orice pagină, dar procesele care rulează în modul non-privilegiat au voie să acceseze doar paginile pentru care SUP conține Biții READ și WRITE controlează accesul de citire și scriere la o anumită pagină De exemplu, dacă procesul i rulează în modul non-privilegiat, poate citi VP și poate citi sau scrie pe VP În același timp, nu este permis să acceseze VP Dacă o instrucțiune încearcă să încalce aceste restricții de acces, CPU generează un semnal general de încălcare a protecției memoriei și transmite controlul către gestionarea excepțiilor kernelului Shell-ul Unix raportează de obicei această excepție ca o eroare de segmentare Capitolul Memoria virtuală Traducerea adresei Această secțiune se referă la problemele legate de traducere Scopul nostru este de a studia mecanismul suportului memoriei virtuale în detaliu suficient pentru a putea realiza noi înșine câteva exemple specifice În același timp, trebuie menționat că omitem unele detalii, în special cele legate de măsurarea timpului, care sunt importante pentru dezvoltatorii de hardware, dar care depășesc interesele noastre În scop de referință, Tabelul enumeră simbolurile pe care le vom folosi în această secțiune Tabelul Rezumatul caracterelor de traducere a adresei parametrii principali Descriere simbol N = n Numărul de adrese din spațiul de adrese virtuale M = m Numărul de adrese din spațiul de adrese fizice P = p Dimensiunea paginii (octeți) Componente VA (adresă virtuală) Descriere simbol VPO Virtual Page Offset în octeți Numărul paginii virtuale VPN Index TLBI în TLB (Buffer de traducere Lookaside) Etichetă TLBT TLB Componentele adresei fizice (PA) Descriere simbol PPO Physical Page Offset în octeți Numărul paginii fizice PPN CO Offset în blocul cache în octeți Indicele CI Cash St Cache Tag Din punct de vedere formal, traducerea adresei este o mapare între N elemente ale spațiului de adrese virtuale (VAS, Virtual Address Space) și M elemente ale spațiului fizic de adrese (PAS, Physical Address Space): MAR :VAS PAS u Partea a II-a Executarea programelor în sistem Unde: □ MAP(A) = A' dacă datele cu adresa virtuală A sunt stocate la adresa fizică A' în spațiul PAS; □ MAP(A) = dacă nu există date la adresa virtuală A în memoria fizică Pe fig Figura arată modul în care MMU utilizează tabelul de pagini pentru a face această mapare Registrul de control al CPU, Registrul de bază al tabelului de pagini (PTBR), indică către tabelul de pagină curent, adresa virtuală „-bit are două componente: offset-ul paginii virtuale p-bit (VPO, Virtual Page Offset) și (n - p )-cifre numărul paginii virtuale (VPN, Virtual Page Number) MMU utilizează VPN-ul pentru a selecta PTE-ul corespunzător De exemplu, VPN selectează PTE , VPN selectează PTE și așa mai departe Adresa fizică corespunzătoare este concatenarea numărului fizic al paginii (PPN) numărat din intrarea tabelului de pagini și offset-ul VPO numărat din adresa virtuală Rețineți că, deoarece atât paginile fizice, cât și cele virtuale au dimensiunea de P octeți, Physical Page Offset (PPO) este identică cu VPO Adresă virtuală Adresa fizică Orez Traducerea adreselor folosind tabelul de pagini Pe fig Figura - arată secvența acțiunilor efectuate de hardware-ul CPU atunci când pagina căutată este în memorie: Procesorul generează o adresă virtuală și o trimite către MMU MMU generează adresa PTE și o solicită din cache sau RAM Capitolul Memoria virtuală Cache/RAM returnează PTE la MMU MMU generează o adresă fizică și o trimite în cache/RAM Memoria cache/RAM returnează procesorului cuvântul de date solicitat Orez Reprezentarea operațiunilor efectuate atunci când paginile căutate sunt prezente Orez Reprezentarea operațiunilor efectuate în absența paginilor căutate Spre deosebire de cazul în care pagina căutată se află într-o locație gestionată în întregime de hardware, gestionarea unei cereri de pagină lipsă necesită interacțiunea între hardware și nucleul sistemului de operare (Figura ) □I (Pașii - ) Primii trei pași sunt la fel ca în fig □ (Pasul ) Bitul de valabilitate din PTE este zero în acest caz, astfel încât MMU ridică o excepție care transferă controlul către gestionarea excepțiilor CPU atunci când o pagină lipsă este accesată în nucleul sistemului de operare □ (Pasul ) Managerul de erori identifică pagina care urmează să fie ștearsă în memoria fizică și, dacă acea pagină a fost modificată, o trimite pe disc Partea a II-a Executarea programelor în sistem □ (Pasul ) Managerul de erori plasează o pagină nouă în spațiul eliberat și actualizează PTE-ul în memorie □ (Pasul ) Manipulatorul de erori returnează controlul procesului inițial și aceasta determină reexecutarea comenzii care a cauzat eșecul CPU trimite din nou adresa virtuală către MMU Deoarece pagina virtuală dorită este acum stocată în memoria fizică, după ce MMU efectuează acțiunile prezentate în Fig , RAM returnează cuvântul solicitat procesorului REGULAMENTUL Având în vedere un spațiu de adresă virtuală de de biți și o adresă fizică de de biți, determinați numărul de biți în VPN, VPO, PPN și PPO pentru următoarele pagini de dimensiunea P: p Numărul de cifre în VPN Numărul de cifre în VPO Numărul de cifre în PPN Numărul de cifre în PPO KB KB KB KB Integrarea cache-ului în memoria virtuală Pentru orice sistem care utilizează atât memoria virtuală, cât și memoria cache SRAM, se poate pune întrebarea dacă memoria cache ar trebui accesată folosind adrese virtuale sau fizice Deși o discuție detaliată a problemelor de schimb nu este subiectul discuției noastre, rețineți că majoritatea sistemelor aleg adresarea fizică Când utilizați adresa fizică, este firesc să Orez Combinând memoria virtuală cu un cache adresabil fizic Capitolul Memoria virtuală o situație în care mai multe procese au blocuri în cache în același timp și partajează blocuri ale acelorași pagini virtuale Mai mult, memoria cache nu este asociată cu mecanismele de securitate, deoarece drepturile de acces sunt verificate în timpul traducerii adresei Pe fig Figura - arată cum o memorie cache adresabilă fizic poate fi combinată cu memoria virtuală Ideea de bază este că traducerea adresei se face înainte ca cache-ul să fie căutat Rețineți că intrările din tabelul de pagini pot fi stocate în cache la fel ca orice alte cuvinte de date Accelerează traducerea adreselor folosind TLB După cum am văzut, de fiecare dată când CPU generează o adresă virtuală, MMU trebuie să apeleze PTE pentru a converti adresa virtuală într-o adresă fizică În cel mai rău caz, aceasta va necesita o preluare suplimentară a memoriei, care va dura de la câteva zeci la câteva sute de cicluri Dacă se dovedește că PTE este stocat în cache la nivelul L , atunci costul este redus la unul sau două cicluri Cu toate acestea, multe sisteme încearcă să elimine chiar și această suprasarcină prin includerea unui mic cache de PTE, așa-numitul Translation Lookaside Buffer (TLB), în MMU TLB este un cache mic, practic adresabil, în care fiecare linie este un bloc format dintr-un singur PTE TLB este de obicei foarte asociat După cum se arată în fig , câmpurile de index și etichetă utilizate pentru selecția seturilor și compararea șirurilor sunt derivate din numărul paginii virtuale din adresa virtuală Dacă tamponul TLB poate conține seturi T = ', atunci indexul TLB (index TLBI) constă din t biți VPN inferiori, iar biții VPN rămași sunt alocați etichetei TLB (etichetă TLBT) p- p+tp»t- rr— [ Etichetă TLB (TLBT) | Indicele TLB (TLBI) | VPO~| VPN Orez Componentele adresei virtuale utilizate pentru a face referire la TLB Pe fig Figura - arată secvența acțiunilor efectuate când TLB este în memorie (situația obișnuită) Important aici este că toate etapele traducerii adreselor sunt efectuate în MMU, ceea ce asigură performanța necesară □ (Pasul ) CPU generează o adresă virtuală □ (Pașii - ) MMU selectează PTE-ul corespunzător din TLB □ (Pasul ) MMU traduce adresa virtuală într-o adresă fizică și o trimite în memoria cache sau RAM Partea a II-a Executarea programelor în sistem □ (Pasul ) Cache/RAM returnează cuvântul de date solicitat către CPU Dacă TLB lipsește, atunci MMU trebuie să preia intrarea PTE din memoria cache L , așa cum se arată în partea de jos a figurii PTE nou selectat este stocat în TLB, eventual suprascriind intrarea existentă cip CPU (b) Date cip CPU Orez Reprezentarea operațiunilor efectuate în prezența sau absența blocului TLB Capitolul Memoria virtuală Tabele de pagini pe mai multe niveluri Până acum, am presupus că sistemul folosește un tabel cu o singură pagină pentru traducerea adreselor Dar dacă am avea un spațiu de adrese de de biți, pagini de K și PTE-uri de octeți, ar trebui să păstrăm în memorie un tabel de pagini de MB în orice moment, chiar dacă aplicația se referea doar la o mică parte a spațiului de adrese virtuale Sarcina devine mult mai dificilă pentru sistemele cu un spațiu de adrese de de biți O abordare comună pentru compactarea unui tabel de pagini este utilizarea unei ierarhii a tabelelor de pagini În sine, această idee este extrem de simplă și o vom explica printr-un exemplu concret Să presupunem că spațiul de adrese virtuale de de biți este paginat în K octeți și fiecare intrare în tabelul de pagini ocupă patru octeți Să presupunem, de asemenea, că la un moment dat, spațiul de adresă virtuală are următoarea formă: primele K ( K corespunde numărului ) pagini de memorie sunt rezervate pentru coduri de program și date, următoarele K pagini sunt libere, următoarele pagini sunt, de asemenea, gratuite, iar următoarea pagină este rezervată pentru stiva de utilizatori Pe fig Figura prezintă o variantă de construire a unei ierarhii pe două nivele pentru acest spațiu de adrese virtuale Memorie virtuală de nivelul Nivelul K pagini VM folosite prd cad și date Pagini VM inactive de K pagini inactiv pagină VM ocupată pentru stivă Orez Ierarhie de tabel de pagini cu două niveluri Fiecărui element al PTE din tabelul de nivel îi este atribuită sarcina de a mapa o zonă de memorie de spațiu de adrese virtuale de MB, cu fiecare Partea a II-a Executarea programelor în sistem o astfel de secțiune este formată din de pagini consecutive De exemplu, PTE reprezintă prima regiune, PTE reprezintă următoarea regiune și așa mai departe Dacă spațiul de adrese este cunoscut a fi de GB, atunci PTE-uri sunt suficiente pentru a acoperi întregul spațiu Dacă niciuna dintre paginile din site-ul i nu este ocupată, atunci elementul PTE i de nivelul este gol De exemplu, în fig secțiunile - sunt gratuite Cu toate acestea, dacă cel puțin o pagină din secțiunea i este alocată, atunci nivelul PTE i indică începutul (baza) unuia dintre tabelele de pagini de nivel , toate sau unele dintre secțiunile , și sunt ocupate, astfel încât PTE-urile lor de nivel indică la baza tabelului de pagini de nivel Fiecare PTE din tabelul de pagini de nivel , ca înainte când ne-am uitat la tabelele de pagini cu un singur nivel, este folosit pentru a mapa o pagină de KB de memorie virtuală Rețineți că atunci când utilizați PTE-uri de octeți, fiecare tabel de pagină de nivel și de nivel are o dimensiune de KB, ceea ce se potrivește în mod convenabil cu dimensiunea paginii Această schemă reduce cerințele de memorie din două motive În primul rând, dacă orice PTE din tabelul de nivel este gol, atunci tabelele de pagini de nivel corespunzătoare pur și simplu nu pot exista Potențial, acest lucru promite economii semnificative de memorie, deoarece majoritatea spațiului de adrese virtuale de GB alocat unui program tipic rămâne nerevendicat În al doilea rând, doar tabelul de nivel trebuie să locuiască în RAM în orice moment Tabelele de pagini de nivel pot fi create și utilizate de sistemul de memorie virtuală pentru a schimba conținutul în ambele direcții, ceea ce reduce sarcina RAM Doar cele mai utilizate tabele de pagini de nivel ar trebui să fie stocate în cache în RAM Adresă virtuală Orez Traducerea adreselor utilizând tabelul paginii la nivel k Orez rezumă descrierea mecanismului de traducere a adresei folosind ierarhia tabelului de pagini până la nivelul L-lea Adresele virtuale sunt împărțite în k numere VPN plus un offset VPO Capitolul Memoria virtuală Fiecare număr /, unde uee #include void *mmap(void *start, size t length, int prot, int flags, int fd, off t offset); Capitolul Memoria virtuală Funcția mmap solicită nucleului să creeze o nouă zonă de memorie virtuală, de preferință una care începe la pornire, și să mapeze porțiunea adiacentă a obiectului specificat de descriptorul de fișier fd (descriptor) la noua zonă Această secțiune adiacentă a obiectului are o lungime de octeți și un offset de octeți decalați de la începutul fișierului Începutul adresei este un punct de referință condiționat, de obicei valoarea sa este NULL Pentru scopurile noastre, vom presupune întotdeauna că adresa de început este NULL Orez ilustrează scopul acestor argumente Orez Interpretarea grafică a argumentelor funcției mmap Argumentul prot conține biți care descriu permisiunea de a accesa regiunea de memorie virtuală nou mapată (adică, biții vm prot din structura regiunii corespunzătoare) □ PROT EXEC - pagini de zona, formate din comenzi ce pot fi executate de procesorul central; □ PROT READ - pagini de zonă disponibile pentru citire; □ PROT WRITE - pagini de zonă disponibile pentru scriere; □ PROT NONE - pagini de zonă nu sunt disponibile pentru circulație Argumentul flags este format din biți care descriu tipul de obiect afișat Dacă bitul flag MAP ANON este setat și fd este NULL, atunci memoria paginată este un obiect anonim și paginile virtuale corespunzătoare sunt umplute cu zerouri Bitul MAP PRIVATE înseamnă un obiect privat copiat la scriere, iar bitul MAP SHARED înseamnă un obiect partajat De exemplu, comanda buff = Mmap(NULL, dimensiune, PROT READ, MAP PRIVATE |MAP ANON, , ) ; există o solicitare către nucleu de a crea o nouă zonă privată de memorie virtuală, doar pentru citire, plină cu zerouri care conțin dimensiunea octeților Dacă cererea are succes, atunci buff conține adresa noului tărâm Partea a II-a Executarea programelor în sistem Funcția munmap elimină zonele date de memorie virtuală: #include #include int munmap(void *start, size t length); Funcția munmap elimină regiunea începând de la începutul adresei virtuale și incluzând octeții de lungime următoare Referințele ulterioare la zona îndepărtată vor eșua cu erori de segmentare HPRAZH!!?” iar E :? Scrieți un program C numit mmapcopy care folosește mmap pentru a copia un fișier de dimensiune arbitrară de pe disc pe ieșire standard Numele fișierului de intrare trebuie să fie transmis ca argument în linia de comandă Alocarea dinamică a memoriei Deși este posibil să se utilizeze funcțiile de nivel scăzut mmap și munmap pentru a crea și elimina regiuni de memorie virtuală, majoritatea programelor C recurg la alocarea dinamică a memoriei atunci când trebuie să obțină memorie virtuală suplimentară în timpul rulării Programul de alocare dinamică a memoriei menține o zonă din memoria virtuală a procesului numită heap (Figura ) Pe majoritatea sistemelor asemănătoare Unix, aceasta este o zonă de memorie cu zero, care începe imediat după zona bss neinițializată și crește în sus în direcția creșterii adreselor Pentru fiecare proces, nucleul menține o variabilă brk (pronunțată „break”) care indică un vârf Alocatorul de memorie menține memoria dinamică ca o colecție de blocuri de diferite dimensiuni Fiecare bloc este o secțiune adiacentă a memoriei virtuale, care este fie alocată (alocată), fie liberă (liberă) Un bloc alocat este rezervat explicit pentru utilizare de către o aplicație Un bloc gratuit este disponibil pentru distribuire Un bloc liber rămâne liber până când este alocat în mod explicit de către aplicație Un bloc alocat rămâne liber până când este eliberat, fie explicit de către aplicație, fie implicit de către alocatorul de memorie însuși Alocatoarele de memorie sunt disponibile în două variante Ambele necesită ca aplicația în sine să aloce în mod explicit blocuri de memorie Ele diferă în funcție de entitate responsabilă pentru eliberarea blocurilor alocate Programele de alocare explicit necesită ca aplicația să elibereze în mod explicit orice bloc alocat De exemplu, biblioteca standard C oferă un program explicit de alocare a memoriei numit malloc Programele C alocă blocuri de memorie cu funcția malloc și blocuri libere de memorie cu Capitolul Memoria virtuală funcții fgee Apelurile la funcțiile new și fge din programele C++ produc același rezultat Pe de altă parte, programele de alocare implicită necesită ca alocatorul de memorie să detecteze când blocul de memorie alocat nu mai este utilizat de aplicație și apoi să elibereze blocul Programele de alocare implicită a memoriei sunt numite și colectori de gunoi (lector de gunoi), iar procesul de eliberare automată a blocurilor de memorie alocate neutilizate se numește colectare de gunoi De exemplu, limbajele de nivel înalt Lisp, ML și Java folosesc un program de colectare a gunoiului pentru a dezaloca blocurile alocate Stivă personalizată eu Zona de memorie pentru biblioteci partajate Decan memorie crescând în vârf (brk ptr) Decan memorie Neinițializat Inițializat Textul programului Orez memorie dinamică Restul acestei secțiuni este dedicat proiectării și implementării programelor de alocare explicită a memoriei În sec ne vom uita la programele implicite de alocare a memoriei Pentru a fi specific, ne vom concentra pe studiul alocătorilor de memorie care manipulează memoria dinamică Cu toate acestea, ar trebui să știți că alocarea memoriei este doar o idee de bază care este interpretată diferit în diferite contexte De exemplu, aplicațiile care se ocupă cu procesarea intensivă a structurilor, cum ar fi graficele, folosesc adesea un alocator de memorie standard pentru a obține un bloc mare de memorie virtuală și apoi folosesc un alocator de memorie specific aplicației pentru a gestiona memoria în blocul alocat nodurile grafului sunt formate și distruse Partea a II-a, Rularea programelor pe sistem malloc și funcții gratuite Biblioteca C Standard oferă un program explicit de alocare a memoriei, care este pachetul utilitar malloc Programele specifice alocă blocuri din memoria dinamică apelând funcția malloc tfinclude void *malloc(size t size); Funcția malloc returnează un pointer către un bloc de memorie de cel puțin dimensiunea octeților, aliniat corespunzător pentru orice fel de obiecte de date pe care blocul le poate conține Pe sistemele Unix cu care suntem deja familiarizați, malloc returnează un bloc aliniat pe o limită de octeți (dword) Mărimea tipului t este definită ca un întreg fără semn Care este lungimea cuvântului? Când discutăm despre mașina A în capitolul , am menționat deja că Intel tratează obiectele de octeți ca fiind cuvinte duble Cu toate acestea, în restul acestei secțiuni, vom presupune că cuvintele sunt obiecte de octeți și că cuvintele duble sunt obiecte de octeți, ceea ce este în concordanță cu terminologia convențională Dacă există complicații în timpul execuției funcției malloc (de exemplu, programul solicită un bloc de memorie mai mare decât memoria virtuală disponibilă), atunci această funcție returnează NULL și setează numărul de eroare errno Funcția malloc nu inițializează memoria returnată Aplicațiile care intenționează să inițializeze memoria dinamică pot folosi funcția calloc, care este un înveliș mic în jurul funcției malloc care inițializează memoria alocată la zero Aplicațiile care trebuie să modifice dimensiunea unui bloc alocat anterior ar trebui să utilizeze funcția realloc Alocatoarele dinamice de memorie, cum ar fi funcția malloc, pot aloca sau dezaloca în mod explicit memorie folosind funcțiile mmap și munmap sau pot folosi funcția sbrk în acest scop: #include void *sbrk(int incr); Funcția sbrk crește sau decrește memoria heap adăugând increment incr la indicatorul kernel brk La succes, returnează vechea valoare a lui brk, altfel returnează - și setează eggpo la ENOMEM Dacă incr este zero, atunci sbrk returnează valoarea curentă a lui brk Apelarea sbrk cu un increment negativ incr este validă, dar nesigură deoarece valoarea returnată (vechea valoare a brk) indică către un nou nod heap la offset abs (incr) octeți Programele eliberează blocurile alocate de memorie dinamică apelând funcția liberă: Capitolul Memoria virtuală #include void free(void *ptr); Argumentul ptr trebuie să indice începutul blocului alocat care a fost primit de la funcția mailoc În caz contrar, comportamentul liber este nedefinit Mai mult, după ce este returnată o valoare goală, funcția gratuită nu anunță în niciun fel aplicația că totul nu este în ordine După cum vom vedea în sec , această circumstanță poate cauza anumite dificultăți și erori de rulare Pe fig Figura - arată cum mailoc și free pot gestiona heap-ul mic de cuvinte într-un program C Fiecare celulă este un cuvânt de octeți Celulele aliniate corespund blocurilor distribuite (umbrite) și libere (nu umbrite) În starea sa inițială, memoria dinamică constă dintr-un singur bloc liber de cuvinte aliniate pe o limită de cuvinte duble □ În partea de sus a fig programul solicită un bloc de cuvinte Funcția mailoc răspunde prin tăierea unui bloc de cuvinte din capul blocului liber și returnarea unui pointer la primul cuvânt al blocului alocat; Partea a II-a Executarea programelor în sistem □ apoi programul cere un bloc de cuvinte, malloc răspunde prin alocarea unui bloc cu cuvinte din partea inițială a blocului liber În acest exemplu, malloc adaugă un cuvânt suplimentar la bloc pentru a se asigura că blocul liber este aliniat pe o limită de cuvinte duble; □ în imaginea următoare, programul cere un bloc de cuvinte, iar malloc răspunde prin tăierea unui bloc de cuvinte din blocul liber; □ Programul eliberează blocul de cuvinte care a fost alocat Rețineți că atunci când funcția liberă revine după apel, p indică în continuare blocul eliberat Ca și înainte, aplicația în sine este responsabilă pentru utilizarea p Utilizarea ulterioară a p este permisă numai după ce a fost inițializat cu un nou apel la funcția malloc; □ în partea de jos a fig programul solicită un bloc de cuvinte În această situație, malloc alocă partea din bloc care a fost eliberată în pasul anterior și returnează un pointer către acest nou bloc Ce este alocarea dinamică a memoriei? Cel mai important motiv pentru care un program folosește alocarea dinamică a memoriei este faptul că adesea nu se știe ce dimensiuni iau anumite structuri de date până când programul este rulat efectiv De exemplu, să presupunem că ni se cere să scriem un program C care citește din stdin într-o matrice C o listă de numere întregi ASCII, un număr pe linie Intrarea este un număr întreg n urmat de u numere întregi care trebuie citite și stocate într-o matrice Cea mai simplă abordare este de a declara matricea static cu o dimensiune maximă codificată (Listing ) gListingYu Citirea unui tablou de numere întregi; MAXN) app error(„Fișierul de intrare este prea mare”); pentru (i = ; i Rk, •••> Rn b Este necesar să se asigure performanța (debitul) maximă a programului de alocare a memoriei, care este definită ca numărul de solicitări executate pe unitatea de timp De exemplu, dacă alocatorul de memorie face de cereri de alocare și de solicitări gratuite într-o secundă, atunci performanța sa este de de operații pe secundă În general, putem obține performanțe maxime reducând la minimum timpul mediu necesar pentru a satisface o solicitare de alocare sau dezalocare a memoriei După cum vom vedea mai jos, nu este atât de dificil să se creeze alocatoare de memorie cu performanțe suficient de ridicate în condițiile în care, în cel mai rău caz, timpul de serviciu de solicitare depinde liniar de numărul de blocuri libere, iar timpul de serviciu de cerere gratuită este constant Capitolul Memoria virtuală A doua cerință este de a obține o eficiență maximă a memoriei Unii programatori începători cred adesea în mod incorect că memoria virtuală este o resursă nelimitată De fapt, cantitatea totală de memorie virtuală alocată tuturor proceselor din sistem este limitată de cantitatea de spațiu pe disc alocată pentru schimb Programatorii cu experiență înțeleg că memoria virtuală este o resursă limitată care ar trebui utilizată eficient Acest lucru este valabil mai ales pentru alocatoarele dinamice de memorie care operează în modul de alocare și dealocare a blocurilor mari de memorie Există mai multe moduri de a evalua cât de eficient folosește un alocator de memorie memoria dinamică În cazul nostru, cel mai potrivit indicator este rata maximă de utilizare Ca și mai înainte, lăsați o secvență de cereri și operațiuni de alocare și eliberare a memoriei Rq, Ri, , Rk, , Rn j Dacă o aplicație solicită un bloc de p octeți, atunci blocul alocat ca urmare a deservirii acestei solicitări are o sarcină utilă de p octeți După ce cererea Rk a fost servită, să presupunem că Pk, care reprezintă suma dimensiunilor utile ale blocurilor alocate în prezent, este dimensiunea totală (sarcină utilă agregată), iar cu Hk notăm valoarea curentă (nedescrescătoare monoton) a dimensiunii memoriei dinamice Apoi, factorul de utilizare de vârf pentru primele cereri, notat cu Uk, este dat de următoarea expresie: și max, mem max addr)) { errno = ENOMEM; return (void *)-l; treizeci} Capitolul Memoria virtuală mem brk += incr; return old brk; } Funcția mem init modelează memoria virtuală accesată din memoria heap (memorie dinamică) ca o matrice mare, aliniată la cuvinte duble, de octeți Octeții încadrați între mem start brk și mem brk reprezintă memoria virtuală alocată Octeții care urmează după membrk sunt memorie virtuală liberă Alocatorul de memorie solicită memorie suplimentară din memoria dinamică apelând funcția mem sbrk, care are aceeași interfață ca și funcția de sistem sbrk și aceeași semantică, cu excepția faptului că nu acceptă cereri de reducere dinamică Alocatorul de memorie în sine este conținut într-un fișier sursă (mailoc c) pe care utilizatorii îl pot compila și conecta la aplicațiile lor Alocatorul de memorie exportă trei funcții în programele de aplicație: int mm init (void) ; void *mm malloc(size t size); void mm free(void *bp); Funcția mm init inițializează alocatorul de memorie, returnând la succes și - în caz contrar Funcțiile mm malloc și mm free au aceleași interfețe și semantică ca și omologii lor de sistem Alocatorul de memorie folosește formatul de bloc prezentat în fig Dimensiunea minimă a blocului este de octeți Lista blocurilor libere este organizată ca o listă implicită a blocurilor libere în forma invariantă prezentată în Fig Orez Forma invariantă a listei libere implicite Primul cuvânt este umplut cu informații nesemnificative și este folosit pentru alinierea limitelor cuvântului dublu Acesta este urmat de un bloc special dedicat prolog, care este un bloc distribuit de opt octeți și constă doar dintr-un antet în partea de sus și un antet în partea de jos Blocul prolog este generat în timpul procesului de inițializare și nu este niciodată eliberat Blocul prolog este urmat de zero sau mai multe blocuri care rezultă din apelurile către mailoc și funcțiile gratuite La sfârșitul memoriei dinamice, există întotdeauna un bloc epilog special - un bloc distribuit de dimensiune zero, care constă doar dintr-un antet Blocurile prologului și epilogului sunt elementele care servesc la Partea a II-a Executarea programelor în sistem eliminarea efectelor de frontieră la îmbinarea blocurilor Alocatorul de memorie folosește o variabilă globală privată (statică) separată (heap listp) care indică întotdeauna blocul prolog (În scopul unei ușoare optimizări, setăm indicatorul la următorul bloc în loc de blocul prolog ) Constante de bază și macrocomenzi pentru gestionarea listei gratuite Lista arată unele dintre constantele de bază pe care le vom folosi în alocatorul de memorie /* constante de bază și definiții macro */ #define WSIZE /♦ dimensiunea cuvântului (în octeți) */ #define DSIZE /* dimensiune dword (în octeți) */ #define CHUNKSIZE ( " ) /* dimensiunea heap inițială (în octeți) */ #define OVERHEAD /* dimensiunea antetului și a câmpului caracteristic (în octeți) */ #define MAX(x, y) ((x) > (y)? (x) : (y)) opt /* împachetează dimensiunea și bitul distribuției într-un cuvânt */ #define PACK(size, alloc) ((size) | (alloc)) unsprezece /* citește și scrie cuvântul la p */ #define GET(p) (*(size t *)(p)) #define PUT(p, val) (*(size t *)(p) = (val)) cincisprezece /* citește dimensiunea și marginile alocate la p */ #define GET SIZE(p) (GET(p) și „ x ) #define GET ALLOC(p) (GET(p) și x ) nouăsprezece /* pentru indicatorul de bloc dat bp calculează adresa antetului său de sus și se îndreaptă în partea de jos */ #define HDRP(bp) ((car *) (bp) - WSIZE) #define FTRP(bp) ((car *)(bp) + GET SIZE(HDRP(bp)) - DSIZE) /* pentru indicatorul de bloc dat bp calculează adresa următorului și blocurile anterioare */ #define NEXT BLKP(bp) ((car *)(bp) + GET SIZE(((car *)(bp) - WSIZE))) #define PREV BLKP(bp) ((car *)(bp) - GET SIZE(((car *)(bp) - DSIZE))) Liniile - stabilesc valorile unor constante de bază care determină dimensiunile: dimensiunea cuvintelor (wsize) și a cuvintelor duble (dsize), dimensiunea blocului liber inițial și dimensiunea implicită a blocului de expansiune a memoriei dinamice ( chunksisize), și Capitolul Memoria virtuală de asemenea, numărul de octeți suplimentari utilizați de anteturile overhead și overhead care sunt legate de supraîncărcarea memoriei Manipularea titlurilor deasupra și dedesubtul listei gratuite poate cauza unele inconveniente, deoarece implică utilizarea intensă a modelelor și a aritmeticii adresei Din acest motiv, considerăm util să oferim un set mic de macrocomenzi pentru accesarea și listarea blocurilor gratuite (liniile - ) □ Macro-ul de despachetare (linia ) concatenează dimensiunea și spațierea distribuției și returnează o valoare care poate fi stocată în titlul de mai sus sau în titlul de mai jos □ Macro-ul get (linia ) citește și returnează cuvântul la care face referire parametrul p Conversia tipului este esențială aici Parametrul p este de obicei un pointer void* care nu poate fi dereferențiat direct □ În mod similar, macro-ul put (linia ) stochează valoarea val în cuvântul a cărui adresă este dată de parametrul p □ Macrocomenzile get size și get alloc (liniile - ) returnează dimensiunea și, respectiv, cifra alocării din antetul de sus sau din antetul de jos de la p Restul macrocomenzilor operează pe pointeri bloc, notați cu bp, care se adresează primului octet al spațiului utilizabil □ Având în vedere un indicator de bloc bp, definițiile macro hdrp și ftrp (liniile - ) returnează pointerii la titlul de deasupra și respectiv de sub bloc □ Următoarele macrocomenzi blkp și prev blkp (liniile - ) returnează pointerii către blocurile următoare și, respectiv, anterior Macro-urile pentru manipularea listei libere pot fi scrise în diferite moduri De exemplu, pentru a determina dimensiunea următorului bloc din memorie, având în vedere indicatorul bp către blocul curent, puteți utiliza următoarea linie de cod: size t size = GET SIZE(HDRP(NEXT BLKP(bp))); Crearea unei liste inițiale de blocuri gratuite Înainte de a apela funcțiile mm maiioc sau nnn free, aplicația trebuie să inițializeze memoria dinamică apelând în acest scop funcția mm init (Listing ) іfisting^O b^Inițializarea memoriei dinamice\ і; , , L M LP « : l ^ G ' int mm init(void) { /* formează memoria dinamică goală inițială */ dacă ((heap listp = mem sbrk( *WSIZE)) == NULL) întoarcere - ; Partea a II-a Executarea programelor în sistem PUT(heap listp, ); /* umplutură pentru aliniere */ PUT(heap listp+WSIZE, PACK(OVERHEAD, )); /* se îndreaptă în partea de sus a prologului */ PUT(heap listp+DSIZE, PACK(OVERHEAD, )); /* titlul din partea de jos a prologului */ PUT(heap listp+WSIZE+DSIZE, PACK( , )); /* îndreptându-se pe partea de sus epilog */ heap listp += DSIZE; unsprezece /* extinde heap gol cu dimensiunea blocului liber CHUNKSIZE octeți */ if (extend heap(CHUNKSIZE/WSIZE) == NULL) retur - ; returnează ; } Funcția mrn init preia patru cuvinte din sistemul de memorie și le inițializează pentru a forma o listă goală de blocuri libere (liniile - ) Apoi apelează funcția extinde heap (Listarea - ), care extinde heap-ul cu octeți de dimensiunea blocului și formează un bloc inițial liber Aici se inițializează alocatorul de memorie și este gata să accepte cereri de la aplicații pentru a aloca și dezaloca memorie a * "aaaaa" g "a"aa" "aa*"ga " "aaaaaaaaaa*aa"aaa"aaaa"a aaaa"aG"a*\aaaaaaG"aaa a""aaaaaaaa**aaaaaaa"aaa^aaa"aaa*b a/^ k"b" *L|^bGa" H"*a^a"a a^bCha aaa rfaaaai void static *extend heap(size t words) { caractere *bp; size t dimensiune; cinci /* alocă un număr par de cuvinte pentru a îndeplini cerințele aliniere */ dimensiune = (cuvinte % ) ? (cuvinte+ ) * WSIZE : cuvinte ♦ WSIZE; dacă ((int)(bp = mem sbrk(size)) \n", argv[ ]); ieșire( ); } /* copiați parametrul de intrare în stdout */ fd = Open(argv[ ], O RDONLY, ) ; fstat(fd, Sistat); mmapcopy(fd, stat st size); ieșire( ); } SOLUȚII ȘI EXERCIȚII Rezolvarea acestei probleme va necesita utilizarea unor concepte de bază, cum ar fi cerințele de aliniere, dimensiunile minime ale blocurilor și codificarea antetului Abordarea generală pentru determinarea dimensiunii blocului este de a rotunji suma spațiului utilizabil solicitat și a antetului, apoi setați dimensiunea la cel mai apropiat multiplu al cerinței de aliniere (în cazul nostru, opt octeți) De exemplu, dimensiunea blocului pentru mailoc( ) este calculată astfel: cererea + = , rotunjită la opt Mărimea blocului pentru mailoc ( ) se calculează după cum urmează: cererea + = , rotunjită la Capitolul Memoria virtuală Solicitare Dimensiunea blocului (în octeți, valoare zecimală) Antet bloc (valoare hexazecimală) malloc( ) x malloc( ) x malloc( ) x malloc( ) x EXERCIȚII DE SOLUȚIE Valoarea dimensiunii minime a blocului poate avea un impact semnificativ asupra fragmentării interne Astfel, este important să înțelegem că dimensiunile minime ale blocurilor sunt legate de diferențele în implementările programului de alocare a memoriei și cerințele de aliniere Dificultatea este de a înțelege că în momente diferite același bloc poate fi într-o stare alocată sau liberă Dimensiunea minimă a blocului este valoarea maximă dintre dimensiunea minimă a blocului alocată și dimensiunea minimă a blocului liber De exemplu, în ultimul exercițiu, dimensiunea minimă a blocului alocată este un antet de patru octeți și o sarcină utilă de un octet, rotunjită la opt octeți Dimensiunea minimă a blocului liber este un antet de sus de patru octeți și un antet de jos de patru octeți, care se adună la un multiplu de opt și nu necesită rotunjire Prin urmare, dimensiunea minimă a blocului pentru acest alocator de memorie este de opt octeți Aliniere Bloc ocupat Bloc liber Dimensiunea minimă a blocului Cuvânt unic Titluri de sus și de jos Titluri de sus și de jos Cuvânt unic Titlu de sus, dar fără titlu de jos Titluri de sus și de jos Cuvânt dublu Titluri de sus și de jos Titluri de sus și de jos Cuvânt dublu Titlu deasupra, dar fără titlu dedesubt Titluri peste și sub SOLUȚIA PENTRU EXERCIȚIUL Nu este nimic complicat aici Dar rezolvarea acestei probleme necesită să aveți o înțelegere solidă a modului în care funcționează alocatorul nostru de memorie implicită simplă și cum să apelați și să traversați blocurile acestuia Partea a II-a Executarea programelor în sistem gol static *find fit(size t asize) { gol *bp; /* caută după prima metodă de potrivire */ pentru (bp = heap listp; GET SIZE (HDRP(bp)) > ; bp = NEXT BLKP(bp) ) { dacă (!GET ALLOC(HDRP(bp)) && (dimensiune = (DSIME + OVERHEAD)) { PUT(HDRP(bp)f PACK(dimensiune, )); PUT (FTRP(bp), PACK(dimensiune, )); bp = NEXTJBLKP(bp); PUT(HDRP(bp), PACK(csize-size, )); PUT(FTRP(bp), PACK(csize-size, )); ȘI } altfel { PUT(HDRP(bp), PACK(csize, )) ; PUT(FTRP(bp), PACK(csize, )) ; cincisprezece } } SOLUȚII ȘI EXERCIȚII Aici avem un model de implementare care provoacă fragmentare externă: aplicația face numeroase solicitări de alocare și dezalocare Capitolul Memoria virtuală alocarea memoriei primei clase de mărime, urmată de solicitări multiple de alocare și dezalocare a memoriei celei de-a doua clase de mărime, urmată de numeroase solicitări de alocare și dezalocare a memoriei celei de-a treia clase de dimensiune și așa mai departe Pentru fiecare clasă de dimensiune, memoria alocatorul alocă o bucată mare de memorie, care nu va fi niciodată solicitată, deoarece alocatorul de memorie nu fuzionează și aplicația nu solicită niciodată din nou blocuri din această clasă de dimensiune PARTEA III Interacțiuni și relații cu programul Până acum, în studierea sistemelor informatice, autorii au făcut presupunerea că programele sunt executate izolat, cu un minim de informații la intrare și la ieșire Cu toate acestea, în practică reală, aplicațiile software folosesc serviciile sistemelor de operare care vizează interacțiunea cu dispozitivele I/O, precum și cu alte programe Această parte a cărții oferă o înțelegere a serviciilor de bază I/O furnizate de sistemele de operare Unix, precum și a modului de utilizare a acestor servicii pentru a crea aplicații, cum ar fi clienții Web și serverele care comunică între ele prin Internet Studenților li se oferă posibilitatea de a învăța tehnici de scriere a programelor paralele (de exemplu, servere web) capabile să deservească simultan un număr mare de clienți Până la sfârșitul acestui capitol, este de așteptat ca cititorul să fie cu adevărat aproape de obiectivul unei înțelegeri aprofundate a sistemelor informatice și a impactului acestora asupra programelor nou create CAPITOLUL Nivel I/O sistem □ I/O Unix □ Deschiderea și închiderea dosarelor □ Citirea și scrierea fișierelor □ Citire și scriere robustă cu pachetul Rio □ Citiți metadatele fișierului □ Partajarea fișierelor □ Redirecționarea datelor I/O □ I/O standard □ Versiune finală: ce caracteristici I/O să folosiți □ Reluați Intrare-ieșire (I/O) este procesul de copiere a datelor între memoria principală și dispozitivele externe: unități de disc, terminale și rețele O operațiune de intrare copiază datele de pe un dispozitiv I/O în memoria principală, iar o operațiune de ieșire copiază datele din memorie pe dispozitivul corespunzător Toate sistemele de rulare a limbajului oferă facilități de nivel înalt pentru efectuarea I/O De exemplu, ANSI C oferă o bibliotecă standard I/O cu funcții precum printf și scanf care realizează I/O tamponat Limbajul C++ oferă funcționalități similare cu operatorii supraîncărcați „(enter) și „(get)” Pe sistemele Unix, aceste funcții I/O de nivel înalt sunt implementate folosind funcțiile I/O Unix la nivel de sistem furnizate de kernel De cele mai multe ori, funcțiile I/O de nivel înalt funcționează bine, așa că nu trebuie să utilizați direct I/O Unix Întrebarea devine atunci: de ce să studiezi I/O Unix? □ Înțelegerea I/O Unix vă permite să înțelegeți cum funcționează alte sisteme I/O este inseparabil de funcționarea sistemului și, din acest motiv, utilizatorii des Partea a III-a Interacțiuni și relații cu programul întâlni dependențe circulare între conceptele I/O ale sistemului și alte concepte De exemplu, I/O joacă un rol cheie în crearea și execuția unui proces și, invers, crearea procesului joacă un rol cheie în partajarea fișierelor între procese Astfel, pentru a înțelege cu adevărat I/O, trebuie să înțelegeți procesele și invers Când luăm în considerare ierarhia memoriei, legării și încărcării, proceselor și memoriei virtuale, autorii au atins deja aspecte ale I/O Acum că aceste concepte sunt clare, putem închide cercul și putem privi procesul I/O mai detaliat □ Uneori nu este de ales decât să utilizați Unix I/O Uneori există situații fundamentale când este fie imposibil, fie nepotrivit să utilizați funcții I/O de nivel înalt De exemplu, biblioteca standard I/O nu oferă acces la metadatele unui fișier, cum ar fi dimensiunea sau timpul de creare a acestuia Mai mult, există probleme cu biblioteca standard I/O care creează riscuri atunci când o folosești în programarea rețelei Acest capitol prezintă conceptele generale ale I/O Unix, I/O standard și cum să le folosiți în siguranță atunci când scrieți programe C Pe lângă faptul că servește ca o introducere generală a subiectului, acest capitol oferă o bază solidă pentru învățarea ulterioară despre programare în rețea și concurență I/O Unix Un fișier Unix este o secvență de m octeți Bo, Ві, , Bh , Bz„ i Toate dispozitivele I/O: rețelele, unitățile de disc și terminalele sunt modelate ca fișiere Atât intrarea cât și ieșirea se fac prin citirea și scrierea fișierelor corespunzătoare Această mapare subțire a dispozitivelor la fișiere permite nucleului Unix să exporte o interfață de aplicație simplă, de nivel scăzut, numită Unix I/O, care asigură că operațiunile de intrare și ieșire sunt efectuate uniform și secvenţial: □ Deschiderea fișierelor O aplicație software își anunță intenția de a accesa un dispozitiv I/O solicitând nucleului să deschidă fișierul corespunzător Nucleul returnează un mic întreg nenegativ, numit descriptor, care identifică fișierul în toate operațiunile ulterioare asupra acestuia Nucleul ține evidența tuturor informațiilor despre un fișier deschis Aplicația monitorizează doar funcționarea mânerului Fiecare proces creat de shell-ul Unix începe cu trei fișiere deschise: • intrare standard (descriptor ); • ieșire standard (descriptor ); • eroare standard (descriptor ) Capitolul Nivelul I/O sistem □ Fișierul antet definește constantele stdin fileno, stdout fileno și stderr fileno care pot fi folosite în locul valorilor descriptorilor explicite □ Schimbați poziția curentă a fișierului Nucleul menține o poziție de fișier k, inițial , pentru fiecare fișier deschis Poziția fișierului este o deplasare de octeți de la începutul fișierului O aplicație poate seta în mod explicit poziția curentă a fișierului prin efectuarea unei operații de căutare □ Citirea și scrierea fișierelor Operația de citire copiază n > octeți din fișier în memorie, începând cu poziția curentă a fișierului k după care k este incrementat cu n Presupunând că fișierul are dimensiunea de m octeți, efectuând o operație de citire când k > m declanșează o condiție cunoscută ca sfârșit de fișier (EOF) care este detectat de aplicație Nu există niciun caracter EOF explicit la sfârșitul fișierului □ În mod similar, o operațiune de scriere copiază n > octeți din memorie într-un fișier, începând de la poziția curentă a fișierului k și apoi actualizând k □ După ce o aplicație termină de accesat un fișier, informează nucleul cu o cerere de închidere a fișierului Nucleul răspunde eliberând structurile de date create la deschiderea fișierului și restabilind descriptorul în pool-ul de descriptori disponibili Când un proces este încheiat din orice motiv, nucleul închide toate fișierele deschise și le eliberează resursele de memorie Deschiderea și închiderea fișierelor Un proces deschide un fișier existent sau creează un fișier nou apelând funcția de deschidere: #include #include #include int open(char *filename, int flags, mode t mode); Funcția de deschidere convertește numele fișierului numele fișierului într-un descriptor de fișier și returnează numărul descriptorului Mânerul returnat este întotdeauna cel mai mic mâner care nu este deschis în prezent în proces Argumentul flags specifică modul în care procesul programează accesul la fișier: □ O RDONLY - numai citire; □ O WRONLY - doar scris; □ O-RDWR - citiți și scrieți Iată cum, de exemplu, un fișier existent este deschis pentru citire: fd = open("foo txt", O RDONLY, ); Argumentul flags poate fi, de asemenea, numai pentru citire cu una sau mai multe măști de biți care oferă comenzi de scriere suplimentare: Partea a III-a Interacțiuni și relații cu programul □ O CREAT - dacă fișierul nu există, atunci ar trebui creată o versiune trunchiată (vide); □ O TRUNC - dacă fișierul există, atunci acesta trebuie trunchiat; □ O ANEXĂ - Înainte de fiecare operație de scriere, setați poziția fișierului la sfârșitul fișierului De exemplu, iată cum puteți deschide un fișier existent cu intenția de a adăuga anumite date: fd = Open("foo txt", O WRONLY | O APPEND, ); Argumentul mode specifică biții de permisiuni de acces pentru fișierele noi Numele simbolice ale acestor biți sunt prezentate în Tabelul Tabelul Biți de permisiune de acces Descrierea măștii S IRUSR Utilizatorul (proprietarul) poate citi acest fișier S IWUSR Utilizatorul (proprietarul) poate scrie acest fișier S IXUSR Utilizatorul (proprietarul) poate executa acest fișier S IRGRP Componentele grupului proprietarului pot citi acest fișier S IWGRP Componentele grupului proprietarului pot scrie în acest fișier S IXGRP Componentele grupului proprietarului pot executa acest fișier S IROTH Alți utilizatori (oricare) pot citi acest fișier S IWOTH Alți utilizatori (oricare) pot scrie acest fișier S IXOTH Alți utilizatori (oricare) pot executa acest fișier Ca parte a contextului său, fiecare proces are o mască dată de funcția umask Când un proces creează un fișier nou apelând funcția deschisă cu un argument de mod, atunci biții de permisiuni de acces la fișiere sunt setați la mode & -umask Să presupunem, de exemplu, că sunt date următoarele valori implicite pentru mode AND umask: #define DEF MODE S IRUSR | S IWUSR | S IRGRP | S IWGRP | S IROTH | S IWOTH #define DEF UMASKS IWGRP | S IWOTH Apoi, următorul fragment de cod creează un fișier nou în care proprietarul fișierului are permisiunea de citire și scriere scrisă, iar toți ceilalți utilizatori au citit această permisiune: umask(DEF UMASK) ; fd = Open("foo txt", O CREAT | O TRUNC | O WRONLY, DEF MODE); Capitolul Nivel I/O sistem În cele din urmă, procesul închide fișierul deschis apelând funcția de închidere #include int close (int fd); Închiderea unui mâner deja închis este o eroare exercitiul Care este rezultatul următorului program? #include „csapp h” int main() { int fdl, fd ; fdl = Open("foo txt", O RDONLY, ); Închidere(fdl); fd = Open("baz txt", O RDONLY, ); printf(”fd = %d\n”, fd ); ieșire( ) ; } Citirea și scrierea fișierelor Aplicațiile software efectuează intrare și ieșire apelând funcțiile de citire și, respectiv, de scriere #include ssiize t read(int fd, void *buf, size t n); Returnare: numărul de octeți citiți dacă este OK, pe EOF, - pe eroare ssiize t write(int fd, const void *buf, size t n); Funcția de citire copiază maximum n octeți din poziția curentă a fișierului fd în locația de memorie buf O valoare returnată de - indică o eroare, iar o valoare returnată de indică sfârșitul fișierului În caz contrar, valoarea returnată indică numărul de octeți transferați efectiv Funcția de scriere copiază cel mult n octeți din locația de memorie buf în poziția curentă a fișierului a descriptorului fd Lista arată un program care utilizează apelurile de citire și scriere pentru a copia intrarea standard în ieșirea standard, câte un octet Partea a III-a Interacțiuni și relații cu programul |T] ist ^ ng ^ ; / KoYirovany ^ staidari-nog vvdda la standardul ѣіvbd #include „csapp h” int main (void) { caractere c; în timp ce (Citiți (STDIN FILENO, &c, ) != ) Scrie (STDOUT FILENO, &c, ); exit( ); } Aplicațiile software pot modifica în mod explicit poziția curentă a fișierului apelând funcția iseek; nu este descris în carte Care este diferența dintre sslze t și slze t Este posibil ca cititorul să fi observat deja că funcția de citire are un argument de intrare de sizejz și o valoare de returnare de ssize t Care este diferența dintre aceste două tipuri? size t este definită ca int unsigned și ssize (dimensiune semnată) este definită ca int Funcția de citire returnează o dimensiune semnată, dar ssize returnează una nesemnată deoarece - ar trebui returnat în caz de eroare Interesant este că capacitatea de a returna o singură valoare - reduce dimensiunea maximă de citire cu un factor de , de la la GB În unele situații, citiți și scrieți transferați mai puțini octeți decât solicită aplicația Astfel de unități de cont scurte nu indică o eroare Se întâmplă din mai multe motive: □ Ciocnire cu EOF în timpul citirii Să presupunem că totul este gata pentru a fi citit dintr-un fișier care conține doar de octeți în plus din poziția curentă a fișierului și că fișierul dat este citit în bucăți de de octeți Apoi următoarea operație de citire va returna un număr scurt de , iar după aceea, funcția de citire va semnala sfârșitul fișierului returnând un număr scurt de □ Citiți rânduri de text din terminal Dacă fișierul deschis este amplasat împreună cu un terminal (adică o tastatură și un monitor), atunci fiecare funcție de citire va include câte o linie de text odată, returnând o unitate de numărare scurtă de dimensiunea unei linii de text □ Citiți și scrieți prize de rețea Dacă fișierul deschis corespunde unui socket de rețea (a se vedea Secțiunea ), atunci limitările interne ale memoriei tampon și latențe lungi de răspuns la rețea pot face ca citirea și scrierea să returneze unități de numărare scurte Impulsurile scurte pot apărea și la apelarea citirii și scrierii pe o conductă Unix, un mecanism de comunicare interprocesor care nu este acoperit aici În practică, este imposibil să întâlniți unități de numărare scurte atunci când citiți de pe fișiere de pe disc, cu excepția cazurilor de EOF, iar unitățile scurte nu vor Capitolul are loc atunci când scrieți pe fișiere de disc Cu toate acestea, dacă scopul este de a crea aplicații de rețea robuste (de încredere), cum ar fi serverele Web, atunci trebuie să se ocupe de unități de numărare scurtă apelând în mod repetat citire și scriere până când toți octeții solicitați au fost transferați Citiți și scrieți consecvent folosind pachetul RIO Această secțiune dezvoltă un pachet I/O numit pachet RIO (Robust I/O) care gestionează automat unitățile de numărare scurtă Pachetul RIO oferă I/O convenabil, fiabil și eficient pentru aplicații precum programele de rețea supuse unităților de numărare scurtă (impulsuri) RIO oferă două tipuri diferite de funcții: □ Funcții I/O fără tampon Aceste funcții transferă date direct între memorie și fișier, fără tamponare la nivel de aplicație Sunt utile în special pentru citirea și scrierea datelor binare în și din rețea □ Funcții de intrare tampon Aceste funcții vă permit să citiți eficient șiruri de text și date binare dintr-un fișier al cărui conținut este stocat în cache într-un buffer la nivel de aplicație, similar cu funcțiile standard I/O, cum ar fi printf Spre deosebire de rutinele I/O buffer prezentate în [ ], funcțiile buffer-ului de intrare R O sunt thread-safe (vezi Secțiunea ) și pot fi intercalate în mod arbitrar pe același descriptor De exemplu, unele șiruri de text pot fi citite dintr-un descriptor, apoi unele date binare și apoi mai multe șiruri de text Procedurile RIO de rutină sunt prezentate din două motive În primul rând, acestea vor fi utilizate în dezvoltarea aplicațiilor de rețea În al doilea rând, studiind codurile pentru aceste rutine, cititorii vor obține o înțelegere mai profundă a principiilor generale ale modului în care funcționează Unix I/O Funcții de intrare și ieșire RIO fără tampon Aplicațiile pot transfera date direct între memorie și un fișier apelând funcțiile rio readn și rio writen #include ssiize t rio readn (int fd, void *usrbuf, size t n) ; ssiize t rio writen(int fd, void *usrbuf, size t n); Returnare: numărul de octeți transferați dacă OK, pe EOF (doar rio readn), - în caz de eroare Funcția rio readn transferă până la n octeți din poziția curentă a fișierului fd în locația de memorie usrbuf În mod similar, funcția rio writen transferă n octeți din locația usrbuf la descriptorul fd Funcția rio readn poate returna o unitate de numărare scurtă numai dacă întâlnește sfârșitul unui fișier Funcţie Partea a III-a Interacțiuni și relații cu programul rio writen nu returnează niciodată unitatea de numărare scurtă Apelurile către rio readn și rio writen pot fi intercalate în mod arbitrar pe același descriptor Listările - arată codul pentru rio readn și rio writen Rețineți că fiecare funcție repornește funcția de citire sau scriere dacă este întreruptă de o întoarcere din aplicația de gestionare a semnalului Pentru o portabilitate maximă, autorii oferă apeluri de sistem intermitente și posibilitatea de a le reîncărca (dacă este necesar) (vezi discuția despre apelurile de sistem intermitente în Secțiunea ) ssiize t rio readn (int fd, void *usrbuf, size t n) { size t nleft = n; size tnread; caractere *bufp = usrbuf; în timp ce (nstânga > ) { dacă ((nread = citit (fd, buff, nleft)) = */ douăzeci } ssiize t rio written (int fd, void *usrbuf, size t n) { size t nleft = n; size t nscris; caractere *bufp = usrbuf; în timp ce (nstânga > ) { dacă ((nscris = scrie (fd, buff, nleft)) void rio readinitb (rio t *rp, int fd); Nu returnează nimic ssiize t rio readlineb(rio t *rp, void *usrbuf, size t maxlen); ssiize t rio readnb(rio t *rp, void *usrbuf, size t n); Funcția rio readinitb este apelată o dată pentru fiecare mâner deschis Asociază descriptorul fd cu un buffer de citire de tip rio t la adresa c Funcția rio readineb citește următoarea linie de text din fișierul r (inclusiv caracterul de sfârșit de linie nouă), o copiază în locația de memorie usrbuf și termină linia de text cu un caracter nul Funcția rio readineb citește maximum maxlen-i octeți, lăsând loc pentru un caracter nul final Șirurile de text mai mari decât maxlen-i octeți sunt trunchiate și terminate cu un caracter nul Funcția rio readnb citește până la n octeți din fișierul rp în locația de memorie usrbuf Apelurile către rio readiineb și rio readnb pot fi intercalate în mod arbitrar pe același descriptor Partea a III-a Interacțiuni și relații cu programul sfâşiat Cu toate acestea, apelurile la aceste funcții buffer nu trebuie să fie intercalate cu apelurile la funcția rio readn fără tampon În restul acestui text, funcțiile RIO vor apărea destul de frecvent Lista arată utilizarea funcțiilor RIO pentru a copia un fișier text de la intrarea standard la ieșirea standard, câte o linie #include „csapp h” int main (int argc, char **argv) { intn; rio t rio; charbuf[MAXLINE]; opt Rio readinitb(&rio, STDIN FILENO); while ((n = Rio readlineb (&rio, buf, MAXLINE)) != ) Rio scris (STDOUT FILENO, buf, n); } Listarea - arată formatul buffer-ului de citire, împreună cu codul pentru funcția rio readinitb care îl inițializează Funcția rio readinitb specifică un buffer de citire gol și asociază un descriptor de fișier deschis cu acest buffer #define RIO BUFSIZE typedef struct { int rio fd;/* handle pentru bufferul intern dat */ int rio cnt;/* octeți necitiți în bufferul intern */ char *rio bufptr; /* următorul octet necitit în bufferul intern */ char rio buf [RIO BUFSIZE]; /* buffer intern */ } rio t; void rio readinitb (rio t *rp, int fd) { rp ->rio fd - fd; rp ->rio cnt = ; rp -> rio bufptr = rp -> rio buf; } Capitolul Nivel I/O sistem Inima rutinelor de citire RIO este funcția rio read, prezentată în Lista Funcția de citire rio este o versiune tampon a funcției de citire Unix static ssiize t rio read (rio t *rp, char *usrbuf, size t n) { int cnt; while (rp ->rio cnt o ) { /* reumple dacă tamponul este gol */ rp ->rio cnt = citire (rp ->rio fd, rp >rio buf, sizeof (rp -> rio buf)); dacă (rp -> rio cnt rio cnt = e ) /* EOF */ returnează ; altfel rp ->rio bufptr = rp ->rio buf; *reîncărcare ptr buffer */ } /* Copiați cel puțin (n, rp ->rio cnt) octeți din bufferul intern către bufferul utilizatorului */ cnt = n; dacă (rp -> rio cnt rio cnt; memcpy (usrbuf, rp -> rio bufptr, cnt); rp ->rio bufptr += cnt; rp ->rio cnt -= cnt; retur cnt; } Când rio read este apelat cu o solicitare de a citi n octeți, atunci există rp->rio cnt octeți necitiți în bufferul de citire Dacă tamponul este gol, atunci acesta este reumplut cu un apel de citire Obținerea unei unități de citire scurtă dintr-o astfel de invocare de citire nu este o eroare și are doar efectul de a umple parțial tamponul de citire Odată ce buffer-ul nu este gol, rio read copie cel puțin n și rp->rio cnt octeți din buffer-ul de citire în buffer-ul utilizatorului și returnează numărul de octeți copiați Pentru un program de aplicație, funcția de citire rio are aceeași semantică ca și funcția de citire Unix În cazul erorilor, returnează - și setează errno în mod corespunzător La sfârșitul fișierului (EOF), funcția returnează Returnează un număr scurt dacă numărul de octeți solicitați este mai mare decât numărul de octeți necitiți din memoria tampon de citire Asemănarea acestor două funcții îl face ușor Partea a III-a Interacțiuni și relații cu programul construirea diferitelor funcții de citire tampon prin înlocuirea rio read cu read De exemplu, funcția rio readnb prezentată în Lista - are aceeași structură ca rio readn, cu rio read înlocuit cu read ssiize t rio readnb (rio t, *rp, void *usrbuf, size t maxlen) { int n, rc; char c, *bufp = usrbuf; cinci pentru ( n = ; n ) { dacă ((nread = rio read (rp, buff, nleft)) = */ douăzeci } Originea pachetului RIO Funcțiile RIO sunt derivate din funcțiile readline, readn și scrise descrise de W Richard Stevens în lucrarea sa clasică despre programarea în rețea [ ] Funcțiile rio readn și rio writen sunt identice cu funcțiile readn și scrise ale lui Stevens Cu toate acestea, funcția readline a lui Stevens are anumite limitări ajustate în RIO În primul rând, deoarece readline este o funcție buffer și readn nu este, acestea nu pot fi utilizate împreună pe același descriptor În al doilea rând, datorită utilizării unui buffer static, funcția de readline a lui Stevens nu este sigură pentru fire, ceea ce necesită ca Stevens să introducă o altă versiune thread-safe numită readline r Autorii au abordat aceste două deficiențe cu funcțiile rio readlineb și rio readnb, care sunt interschimbabile și sigure pentru fire Citirea metadatelor fișierului O aplicație software poate prelua informații despre un fișier (uneori numite metadate ale fișierului) apelând funcțiile stat și fstat #include tfinclude int stat (const char *filename, struct stat *buf); int fstat (int fd, struct stat *buf); Funcția stat ia un nume de fișier ca intrare și completează componentele structurii de stat prezentate în Lista - Funcția fstat este similară, dar folosește un descriptor de fișier în loc de un nume de fișier Când luăm în considerare serverele Web din Sec va necesita componentele stjnode și st size ale structurii stat Alte componente nu sunt luate în considerare de către autori „w ” ,y ;a ^Listing I ' o; Componentele structurii ' K "aavvaa" ae "aige" eіK "aaa*aab Îs > foo TXT face ca shell-ul să încarce și să execute programul is, redirecționând ieșirea standard către fișierul de disc foo txt După cum se va vedea în sec , un server Web efectuează un tip similar de redirecționare atunci când execută un program CGI în numele unui client Deci, cum funcționează redirecționarea datelor I/O? O modalitate este de a folosi funcția dup #include int dup (int oldfd, int newfd); Funcția dup copiază intrarea oldfd din tabelul descriptor în intrarea newfd din tabelul descriptor, suprascriind conținutul anterior al intrării newfd din tabelul descriptor Dacă elementul de intrare newfd este deja deschis, atunci dup închide newfd ÎNAINTE de a copia oldfd Să presupunem că înainte de a apela dup ( , ) obținem situația prezentată în Fig , unde descriptorul de fișier (ieșire standard) corespunde fișierului A (să zicem, un terminal) și descriptorul de fișier corespunde fișierului B (să zicem, un fișier de disc) Numărul de legături pentru A și B este În fig Figura - arată situația după apelarea dup ( , ) Ambii descriptori indică acum fișierul B; fișierul A a fost închis și intrările sale v din tabelul de fișiere și tabelul de noduri v au fost șterse; referința unității de numărare pentru B a fost mărită cu unu Din acest moment, toate datele scrise la ieșirea standard sunt redirecționate către fișierul B Indicatoare la dreapta și la stânga Pentru a evita confuzia cu alți operatori de tip paranteză, cum ar fi ] și [, operatorul shell > este întotdeauna referit de către autori drept „indicator săgeată la dreapta” și operatorul extern FILE *stdin; /* intrare standard (mânerul ) */ extern FILE *stdout; /* ieșire standard (descriptor ) */ extern FILE *stderr; /* eroare standard (mânerul ) */ Un flux de tip FILE este o abstractizare pentru un descriptor de fișier și un buffer de flux Scopul bufferului de flux este același cu cel al bufferului de citire RIO: minimizarea numărului de apeluri costisitoare de sistem Unix I/O De exemplu, să presupunem că aveți un program care face apeluri multiple către funcția I/O standard gete, unde fiecare apel returnează următorul caracter din fișier Prima dată când gete este apelat, biblioteca umple bufferul de flux cu un singur apel de citit, apoi returnează primul octet din buffer către aplicație Atâta timp cât mai sunt octeți necitiți în buffer, apelurile gete ulterioare pot fi servite direct din buffer-ul fluxului Asamblare finală: ce funcții I/O ar trebui să utilizați? Pe fig Figura prezintă o diagramă generală a diferitelor pachete I/O discutate în acest capitol I/O Unix este implementat în nucleul sistemului de operare Este disponibil pentru aplicații prin funcții precum deschidere, închidere, căutare, citire și scriere Funcțiile RIO de nivel înalt și funcțiile standard I/O sunt implementate „pe deasupra” (folosind) funcțiile Unix I/O Funcțiile RIO sunt pachete robuste de citire și scriere concepute special pentru această carte Ele gestionează automat unitățile de numărare scurtă ( impulsuri) și oferă o abordare eficientă a tamponării pentru citirea liniilor de text Funcțiile standard de I/O oferă o alternativă de tampon mai completă la funcțiile Unix I/O, inclusiv rutinele I/O formatate de rutină Deci, care dintre aceste funcții ar trebui să fie folosite atunci când scrieți programe? Funcțiile standard I/O sunt o metodă de selectare a I/O pe disc și periferice Majoritatea programatorilor C folosesc I/O standard exclusiv de-a lungul carierei lor, fără a accesa niciodată funcțiile de I/O Unix de nivel scăzut Acolo unde este posibil, autorii recomandă să fie urmat același principiu Capitolul Nivel I/O sistem fopen fdopen friad fwrite fscanf fprintf sscanf sprintf fgets fputs ffiush fseek fclose citire deschisă scrie Iseek stat aproape Aplicație în C Funcție standard I/O Funcții Unix I/O Funcții RIO rio readn rio writen rio readinitb rio readlineb rio readnb Orez Relația dintre I/O Unix, I/O standard și RIO Din păcate, I/O standard devine o sursă de probleme foarte enervante atunci când încercați să-l utilizați în rețele În sec descrie un fișier numit socket care servește ca abstractizare Unix pentru rețea Ca orice fișier Unix, descriptorii de fișiere fac referințe la socket și în acest caz sunt numiți descriptori de socket Procesele aplicației software comunică cu procesele care rulează pe alte computere prin citirea și scrierea descriptorilor de socket Fluxurile I/O standard sunt full duplex, în sensul că programele pot intra și ieși pe același flux Cu toate acestea, există restricții asupra fluxurilor care interacționează slab cu restricții asupra socket-urilor: Funcții de intrare după funcțiile de ieșire O funcție de intrare nu poate urma o funcție de ieșire fără un apel intermediar la ffiush, fseek, fsetpos sau rewind Funcția ffiush eliberează buffer-ul asociat fluxului Ultimele trei funcții folosesc funcția Unix I/O iseek pentru a reseta poziția curentă a fișierului Funcții de ieșire după funcțiile de intrare O funcție de ieșire nu poate urma o funcție de intrare fără un apel intermediar la fseek, fsetpos sau rewind, cu excepția cazului în care funcția de intrare întâlnește sfârșitul fișierului Aceste restricții cauzează probleme pentru o aplicație de rețea, deoarece iseek nu este permis pe un socket Prima limitare a fluxului I/O poate fi „rezolvată” prin adoptarea practicii de a spăla buffer-ul înainte de fiecare execuție a unei operațiuni de intrare Cu toate acestea, singura modalitate de a ocoli cea de-a doua limitare este să deschideți două fluxuri pe același deschis descriptor de socket, unul pentru citire și celălalt pentru scriere : FIȘIER *fpin, *fpout; fpin = fdopen(sockfd, "r"); fpout = fdopen(sockfd, "w"); Partea a III-a Interacțiuni și relații cu programul Cu toate acestea, această abordare întâmpină și probleme deoarece necesită ca aplicația să apeleze fciose pe ambele fire de execuție pentru a elibera resursele de memorie asociate fiecărui fir pentru a evita „scurgeri de memorie”: fciose(fpin); fciose(fpout); Fiecare dintre aceste operații încearcă să închidă același descriptor de socket subiacent, astfel încât a doua operațiune de închidere eșuează Pentru programele secvenţiale, aceasta nu este o problemă, dar închiderea unui mâner deja închis într-un program threaded este o soluţie (vezi Secţiunea ) Astfel, autorii recomandă să nu se utilizeze I/O standard pentru aceste operațiuni pe socluri de rețea În schimb, ar trebui folosite funcțiile RIO Dacă este nevoie de ieșire formatată, utilizați funcția sprint pentru a formata șirul în memorie, apoi trimiteți-l la soclu folosind rio writen Dacă este nevoie de intrare formatată, utilizați rio readlineb pentru a citi întreaga linie de text, apoi utilizați sscanf pentru a extrage diferitele câmpuri din linia de text rezumat Unix oferă un număr mic de funcții la nivel de sistem care vă permit să deschideți, să închideți, să citiți și să scrieți fișiere, să selectați metadatele fișierelor și să efectuați redirecționarea I/O Citirile și scrierile Unix sunt supuse unor unități de numărare scurte (impulsuri) pe care programele de aplicație trebuie să le prezică și să le gestioneze corect În loc să apeleze direct funcțiile Unix I/O, aplicațiile ar trebui să utilizeze pachetul RIO, care gestionează automat unitățile de numărare scurtă, efectuând mai multe citiri și scrieri până când toate datele solicitate au fost transferate Nucleul Unix folosește trei structuri de date asociate pentru a reprezenta fișierele deschise Intrările din tabelul descriptor indică intrările din tabelul fișier deschis, care la rândul lor indică intrările din tabelul nod v Fiecare proces are propriul său tabel de descriptori dedicat, în timp ce toate procesele partajează un tabel de fișiere deschis și tabelul nod v Organizarea generală a acestor structuri contribuie la înțelegerea atât a partajării fișierelor, cât și a redirecționării I/O Biblioteca standard I/O este implementată „pe deasupra” I/O Unix și oferă un set puternic de rutine I/O de nivel înalt Pentru majoritatea programelor de aplicație, I/O standard este o alternativă mai simplă și preferată la funcțiile Unix I/O Cu toate acestea, din cauza anumitor restricții reciproc incompatibile între I/O standard și fișierele de rețea, aplicațiile de rețea ar trebui să utilizeze I/O Unix mai degrabă decât I/O standard Capitolul Nivel I/O sistem Note bibliografice Stevens a scris un text de referință standard pentru funcțiile Unix I/O [ ] Kernighan (Kemighan) și Ritchie (Ritchie) oferă o discuție clară și exhaustivă a funcțiilor input-output standard [ ] Sarcini pentru soluție acasă EXERCIȚIUL ♦ Care este rezultatul următorului program: #include „csapp h” int main() { int fdl, fd ; fdl = Open("foobar txt", O RDONLY, ); fd = Open("foobar txt", O RDONLY, ); Închidere (fd ); fd = Open("baz txt", O RDONLY, ) ; printf("fd = %d\n", fd ); ieșire( ); } EH și E , ♦ Modificați programul cpfile prezentat în Lista pentru a utiliza funcțiile RIO pentru a copia intrarea standard la ieșirea standard, MAXBUF octeți la un moment dat EXERCITIUL unsprezece Scrieți o versiune a programului statchech prezentat în Lista - numită fstatcheck, care ia un număr de descriptor pe linia de comandă mai degrabă decât un număr de fișier EXERCIȚIUL E Luați în considerare următorul apel la programul fstatcheck de la Ex : unix > fstatcheck ; unsigned long int htonl(unsigned long int hostlong); unsigned short int htons(unsigned short int hostshort); unsigned long int ntohl(unsigned long int netlong); unsigned short int ntohs(unsigned short int netshort); Funcția hotnl schimbă ordinea octeților a unui număr întreg de de biți acceptat de gazdă în ordinea octeților acceptată de gazdă Funcția ntohl modifică endianitatea unui număr întreg pe de biți de la gazdă la endianitatea rețelei Funcțiile htons și ntohs efectuează conversiile corespunzătoare pe numere întregi de biți Partea a III-a Interacțiuni și relații cu programul De obicei, o persoană lucrează cu adrese IP reprezentate într-un format cunoscut sub numele de notație zecimală punctată, în care fiecare octet este reprezentat prin valoarea sa zecimală și este separat de alți octeți printr-un punct De exemplu, este reprezentarea zecimală a adresei x c f Pe un sistem de operare Linux, puteți utiliza comanda hostname pentru a afla adresa propriului computer în notație zecimală punctată: linux > nume de gazdă -i Programele de internet convertesc adresele IP în șiruri zecimale punctate și invers, folosind funcțiile inet aton și inet ntoa: #include int inet aton(const char *cp, struct in addr *inp); char *inet ntoa(struct in addr in); Funcția inet aton convertește un șir de valori zecimale punctate într-o adresă IP în ordinea octeților de rețea În mod similar, funcția inet ntoa convertește adresele IP în ordinea octeților primite în rețea în șirul său zecimal punctat corespunzător Rețineți că apelul funcției inet aton transmite un pointer către structură, în timp ce apelul funcției inet ntoa trece structura însăși Ce înseamnă ntoa și aton? Litera „n” înseamnă reprezentare în rețea (rețea), litera „a” - reprezentarea adoptată în cerere (aplicare), „către” înseamnă transfer EXERCIȚIUL Completează următorul tabel: Adresă hexazecimală Adresă zecimală punctată x Oxffffffff OxefOOOOOL Capitolul Programarea în rețea EXERCIȚIUL Scrieți un program hex dd c care își convertește argumentul hexazecimal într-un șir de valori zecimale punctate și imprimă rezultatul conversiei De exemplu, hex> /hex dd x c f EXERCIȚIU: NI Scrieți un program dd hex c care își convertește șirul de valori zecimale punctate într-un argument hexazecimal și imprimă rezultatul conversiei De exemplu, unix> /dd hex x c f nume de domenii de internet Clienții și serverele de internet folosesc adrese IP atunci când comunică între ei În același timp, oamenii sunt prost să-și amintească numerele lungi, așa că Internetul, pe lângă adresele IP, anunță un set special de nume de domenii ușor de utilizat, precum și un mecanism care mapează multe nume de domenii la multe adrese IP Un nume de domeniu este o secvență de cuvinte (litere, cifre și liniuțe) separate între ele prin puncte, de exemplu: kittyhawk cmcl cs emu edu Setul de nume de domenii formează o ierarhie și fiecare nume de domeniu își codifică poziția în această ierarhie Cel mai simplu mod de a înțelege acest lucru este cu un exemplu Pe fig Figura prezintă o parte din ierarhia numelor de domeniu Această ierarhie este reprezentată ca un arbore Nodurile arborelui reprezintă numele de domenii, care se formează prin parcurgerea arborelui spre rădăcina acestuia Subarborele sunt interpretate ca subdomenii Primul nivel al ierarhiei formează nodul rădăcină fără nume Următorul nivel este o colecție de nume de domenii de prim nivel definite de o organizație non-profit numită ICANN (Internet Corporation for Assigned Names and Numbers, o nouă organizație non-profit pentru atribuirea de adrese și nume pe Internet, parametrii de protocol, managementul sistemelor de nume de domenii) De obicei, domeniile de prim nivel includ cell, edu, gov, org și net La nivelul următor sunt numele de domenii de nivel al doilea, cum ar fi cmu edu, care sunt atribuite pe principiul primul venit, primul servit de către diverși agenți autorizați ai organizației ICANN Odată ce o organizație a obținut un nume de domeniu de nivel al doilea, are capacitatea de a crea alte nume de domeniu noi în cadrul subdomeniului său Internetul definește o corespondență între un set de nume de domenii și un set de adrese IP Până în , această corespondență a fost stabilită manual într-un special Partea a III-a Interacțiuni și relații cu programul fișier text numit hosts txt De atunci, această corespondență a fost menținută într-o bază de date mondială cunoscută sub numele de DNS (Domain Naming System, Domain Name Service) În teorie, baza de date DNS constă din multe milioane de structuri de domenii de intrare prezentate în Lista - , fiecare dintre acestea declarând o corespondență între un set de nume de domenii (nume oficial și listă de nume alternative) și un set de adrese IP Din punct de vedere matematic, vă puteți gândi la o intrare gazdă ca la o clasă de echivalență de nume de domenii și adrese IP Nume de domenii de nivel superior Nume de domenii de nivel al doilea Nume de domenii de nivel al treilea Kittyhawk Imperial Orez Un subset al ierarhiei numelor de domenii Internet ^Listing Structura șirurilor LP a PNStr, struct host { char*h name; /* nume de domeniu gazdă oficial */ char **h aliases; /* matrice de nume de domenii terminate cu nul */ int h addrtype; /* tipul adresei gazdei (AF INET) ★/ int h lungime; /* lungimea adresei în octeți */ char **h adr list; /* matrice terminată cu nul în structurile in addr */ }; Aplicațiile Intemet obțin intrări arbitrare de gazdă din baza de date DNS apelând funcțiile gethostbyname (găsește o gazdă după nume) și gethostbyaddr (găsește o gazdă după adresă) #include struct hostent *gethostbyname(const char *name); struct hostent *gethostbyaddr(const char *addr, int len, ); Capitolul Programarea în rețea Funcția gethostbyname returnează intrarea gazdei asociată cu calea numelui de domeniu Funcția gethostbyaddr returnează intrarea gazdei asociată cu adresele IP addr Al doilea argument este lungimea adresei IP în octeți, care este întotdeauna de patru octeți în versiunea curentă a Internetului Pentru scopurile noastre, al treilea argument este întotdeauna zero Putem explora unele dintre proprietățile de mapare ale DNS cu programul hostinfo prezentat în Listarea , care citește un nume de domeniu sau o adresă zecimală punctată din linia de comandă și afișează intrarea gazdă corespunzătoare #include „csapp h” int main(int argc, char **argv) { caractere **pp; struct in addr addr; struct hostent *hostp; Ѳ dacă (argc !s ) ( fprintf(stderr, ”utilizare: %s \n”, argv[ ]); ieșire( ); } paisprezece dacă (inet aton(argv[l], &addr) != ) hostp = Gethostbyaddr((const char *)&addr, sizeof(addr), AF INET); altceva hostp = Gethostbyname(argv[ ]); nouăsprezece printf("nume gazdă oficial: %s\n", hostp->h name); pentru (pp = hostp->h aliases; *pp != NULL; pp++) printf(”alias: %s\n”, *pp); pentru (pp = hostp->h adr list; *pp != NULL; pp++) { addr s addr = *( (unsigned int *)*pp); printf("adresa: %s\n", inet ntoa(adresa)); } ieșire( ); treizeci} Fiecare gazdă de internet are un nume de domeniu definit local, localhost, care se mapează întotdeauna la adresa de loopback : Partea a III-a Interacțiuni și relații cu programul unix> /hostinfo localhost numele gazdă oficial: localhost alias: localhost localdomain adresa: Numele localhost oferă o modalitate convenabilă și portabilă de a se referi la clienți și servere care rulează pe aceeași mașină, ceea ce poate fi foarte util la depanare Putem folosi programul de nume de gazdă pentru a determina numele real de domeniu al gazdei noastre locale: unix > /hostname kittyhawk crncl cs emu edu În cel mai simplu caz, există o mapare unu-la-unu între un nume de domeniu și o adresă IP: unix> /hostinfo kittyhawk cmcl cs cmu edu numele gazdă oficial: kittyhawk cmcl cs cmu edu adresa: Cu toate acestea, în unele cazuri, mai multe nume de domenii sunt mapate la aceeași adresă IP simultan: unix> /hostinfo cs mit edu numele gazdă oficial: EECS MIT EDU alias: cs mit edu adresa: În cel mai general caz, mai multe nume de domenii se pot mapa la mai multe adrese IP: unix> /hostinfo www aol com numele gazdă oficial: aol com alias: www aol com adresa: adresa: adresa: În cele din urmă, observăm că unele numere de domenii valide nu se mapează la nicio adresă IP: unix> /hostinfo edu Eroare Gethostbyname: Nu există nicio adresă asociată cu acest nume unix> /hostinfo cmcl cs cmu edu Eroare Gethostbyname: Nu există nicio adresă asociată cu acest nume Notă Din , Internet Software Consortium (www isc org) a efectuat un sondaj bi-anual asupra domeniilor Internet Un raport care oferă o estimare a numărului de gazde Internet prin numărarea numărului de adrese IP care Capitolul Programarea în rețea au fost atribuite unui anumit nume de domeniu, au descoperit o tendință interesantă Din , când existau doar aproximativ de gazde pe Internet, numărul gazdelor s-a dublat aproximativ în fiecare an Până în iunie , pe Internet existau peste de milioane de gazde HP? A ^ N E N ȘI E Compilați programul hostinfo prezentat în Lista - Apoi rulați hostinfo aol com de trei ori la rând pe sistemul dvs Ce puteți spune despre ordonarea adreselor IP în cele trei intrări gazdă? Cum poate fi utilă această comandă? conexiuni la internet Clienții și serverele de Internet comunică între ele prin trimiterea și primirea fluxurilor de octeți O conexiune se numește punct la punct în sensul că stabilește o legătură de date între două procese Aceasta este o conexiune full-duplex, în care datele pot fi transmise în ambele direcții în același timp În același timp, o astfel de conexiune este considerată fiabilă în sensul că, în afară de unele evenimente catastrofale, precum deteriorarea unui cablu de către un operator de lopată notoriu imprudent, fluxul de octeți trimis de procesul sursă va fi în cele din urmă recepționat de către proces de destinație în ordinea în care a fost trimis Un socket reprezintă punctul final al unei conexiuni Fiecare socket are propria sa adresă de socket, care constă dintr-o adresă de Internet și un port întreg de biți, notat ca adresă:port Portul din adresa socket-ului unui client este atribuit automat de nucleu în momentul în care clientul face o cerere de conectare și este numit port efemer În același timp, portul din adresa gazdei serverului este de obicei un port binecunoscut care este asociat cu serviciul corespunzător De exemplu, serverele Web folosesc de obicei portul , în timp ce serverele de e-mail folosesc portul Pe mașinile care rulează un sistem de operare Unix, fișierul /etc/services conține o listă detaliată a serviciilor furnizate pe acea mașină, precum și o listă de bune porturi cunoscute O conexiune este identificată în mod unic prin adresele de socket ale ambelor puncte finale O astfel de pereche de adrese de socket se numește pereche de socket și este notat cu următorul tuplu (cliaddr:cliport, servaddr:servport), unde cliaddr este adresa IP a clientului, cliport este portul clientului, servaddr este adresa IP a serverului și servport este portul serverului De exemplu, în fig Figura - prezintă o conexiune între un client Web și un server Web În acest exemplu, adresa socket-ului clientului Web este : , unde este indicatorul de port efemer atribuit de nucleu Adresa socket-ului serverului Web este : , unde portul este portul frumos asociat serviciului Web corespunzător Când sunt date aceste adrese de client și server, conexiunea dintre client și server este identificată în mod unic printr-o pereche de socket ( : , : ) Ѳ Partea a III-a Interacțiuni și relații cu programul adresa socket-ului clientului : Adresa socketului serverului : Adresa gazdei clientului Adresa gazdei serverului Orez Anatomia unei conexiuni la internet Originea rețelei Internaționale Internetul este una dintre cele mai de succes interacțiuni dintre guvern, universitate și industrie Mulți factori au contribuit la succesul său, dar credem că cel mai important este faptul că guvernul Statelor Unite i-a oferit sprijin financiar pe o perioadă de de ani, precum și dăruirea cu care dezvoltatorii au lucrat pentru a aduce proiectul spre fructificare Semințele internetului au fost semănate în , când, în apogeul Războiului Rece, Uniunea Sovietică a șocat lumea lansând satelitul său, primul satelit artificial al Pământului, în spațiu Ca răspuns, guvernul Statelor Unite a creat ARPA (Advanced Research Projects Agency, Advanced Research Projects Agency), care a fost însărcinat cu restabilirea liderului SUA în știință și tehnologie În , Lawrence Roberts de la ARPA a publicat planuri pentru o nouă rețea numită ARPANET (Advanced Research Projects Agency network) Primele noduri ARPANET au început să funcționeze în Până în , existau deja noduri ARPANET, iar e-mailul a apărut ca prima aplicație importantă de rețea În , Robert Kahn a formulat principiile generale de interconectare: un set de rețele interconectate, schimbul de date între aceste rețele se realizează în mod independent, conform principiului aplicării obligatorii a eforturilor maxime prin utilizarea cutiilor negre, numite „routere” În , Kahn și Vinton Cerf au publicat primele detalii ale protocolului TCP/IP, care până în devenise protocolul standard de interfuncționare pentru ARPANET La ianuarie , fiecare nod al ARPANET a fost comutat la protocolul TCP / IP, această dată a devenit ziua de naștere a rețelei globale de Internet care funcționează pe baza protocolului IP În , când Paul Mockapetris a inventat sistemul de nume de domeniu (DNS), existau aproximativ de gazde pe internet În anul următor, NSF (Național Science Foundation, US National Science Foundation) a construit rețeaua principală NSFNET, conectând site-uri prin linii telefonice dial-up cu o rată de transfer de date de Kb/s Ulterior, în , s-au folosit linii de comunicație T , oferind o rată de transfer de date de , Mb/s, iar în au fost utilizate linii de comunicație T , oferind o rată de transfer de date de Mb/s În erau peste de gazde În , ARPANET original a fost reorganizat oficial Capitolul Programarea în rețea a inceput sa existe În , când existau aproximativ milioane de gazde pe Internet, NSF a dispărut NSFNET, înlocuindu-l cu o arhitectură de rețea modernă bazată pe rețele backbone comerciale dedicate conectate prin hotspot-uri de rețea publice interfață socket Interfața socket este un set de funcții care sunt utilizate împreună cu funcțiile I/O ale sistemului de operare Unix pentru a construi aplicații de rețea Este implementat pe majoritatea sistemelor moderne, inclusiv pe toate variantele de sisteme de operare Unix, Windows și Macintosh Orez oferă o idee despre interfața socket în contextul unei tranzacții normale client-server Ar trebui să utilizați această cifră ca foaie de parcurs atunci când discutați despre caracteristicile individuale Orez Prezentare generală a interfeței socketului Originea interfeței socket Interfața socket a fost dezvoltată de cercetătorii de la Universitatea din California din Berkeley la începutul anilor Din acest motiv, este adesea denumită prize Berkeley Cercetătorii de la Berkeley au dezvoltat o interfață socket care vă permite să lucrați cu orice protocol de bază Prima implementare a fost un protocol pe care au încorporat nucleul Unix BSD (Berkeley Software Distribution, un produs software al Universității din California) și l-au distribuit în numeroase universități și laboratoare A fost important Partea a III-a Interacțiuni și relații cu programul eveniment din istoria internetului Practic peste noapte, mii de utilizatori au obținut acces la protocolul TCP/IP și la codurile sale sursă Acest lucru a creat o emoție extremă în rândul utilizatorilor și a stimulat cercetări suplimentare în rețele și interconectare Structuri de adrese de socket Din punctul de vedere al nucleului sistemului de operare Unix, un socket reprezintă punctul final al unei conexiuni Din punctul de vedere al unui program de sistem Unix, un socket este un fișier deschis cu descriptorul de fișier corespunzător Adresele de socket de pe Internet sunt stocate ca structuri de octeți de tip sock addr in, prezentate în Lista Pentru aplicațiile lnternet, membrul sin family este af inet, membrul sin port este un număr de port de biți, iar membrul sin addr este o adresă IP de de biți Adresa IP și numărul portului sunt întotdeauna stocate în ordinea octeților de rețea (stub end) j Lista Adresă structuri de cochete / /* Adresă partajată a structurii socket-ului (pentru conectare, legare și primire) ★/ struct sockaddr { nesemnat scurt sa family; /* familie de protocol */ char sa data[ ]; /* date de adresă */ }; /* Structura adresei socket stil Internet */ struct sockaddr in { nesemnat scurt sin family; /* familie de adrese (întotdeauna AF INET) */ unsigned short sin port; /* numărul portului în ordinea octeților de rețea */ struct in addr sin addr; /* Adrese IP în ordinea octeților de rețea */ unsigned char sin zero[ ]; /* loc pentru valoare sizeof(struct sockaddr) */ }; Funcțiile de conectare necesită un pointer către o structură de adrese de socket specifică protocolului Problema cu care se confruntă proiectanții de interfețe de socket este cum să definească aceste funcții, astfel încât să poată funcționa cu orice structură de adrese de socket Vom folosi acum indicatorul generic void*, care nu exista în acel moment în C Soluția a fost să definim funcții socket care așteptau un pointer către structura generică sockaddr și apoi să solicite aplicațiilor să arunce pointeri către acea structură partajată în protocol -structuri specifice Pentru a simplifica codurile noastre de programare, să urmăm instrucțiunile lui Stevens și să definim următorul tip: typedef struct sockaddr SA; Capitolul Programarea în rețea Vom folosi apoi acest tip ori de câte ori trebuie să turnăm structura sockaddr in într-o structură sockaddr generică functia priza Clienții și serverele folosesc funcția socket pentru a construi un handle de socket: ttinclude ttinclude int socket (domeniu int, tip int, protocol int); În codul nostru, apelăm întotdeauna funcția socket cu argumente clientfd = Socket(AF INETZ SOCK STREAM, ); unde af inet indică faptul că vom folosi Internetul, iar sock stream indică faptul că socket-ul va fi punctul final al conexiunii la Internet Mânerul clientfd returnat de funcția socket este doar parțial deschis și nu poate fi folosit în operațiuni de citire sau scriere Modul în care finalizam procedura de deschidere a socketului depinde dacă suntem client sau server Următoarea subsecțiune descrie modul în care completăm procedura de deschidere a soclului ca client funcția de conectare Clientul stabilește o conexiune la server apelând funcția de conectare: #include int connect(int sockfd, struct sockaddr *serv addr, int addrlen); Funcția de conectare încearcă să stabilească o conexiune la Internet la un server la adresa socket serv addr, unde addrlen este valoarea sizeof (sockaddr in) Funcția de conectare blochează execuția până când fie conexiunea este stabilită cu succes, fie apare o eroare Dacă conexiunea este stabilită cu succes, mânerul sockfd este apoi gata să citească și să scrie, iar conexiunea stabilită este descrisă de o pereche de socket (x:y, serv addr sin addr:serv addr sin port) unde x este adresa IP a clientului și y este un port efemer care identifică în mod unic procesul client care rulează pe gazda client funcția open clientfd Am ajuns la concluzia că este convenabil să reprezentăm funcțiile socket și connect ca o funcție de ajutor numită open clientfd pe care clientul o poate folosi pentru a stabili o conexiune: #include „csapp h” int open clientfd(char *nume gazdă, int port); Partea a III-a Interacțiuni și relații cu programul Funcția open clientfd stabilește o conexiune la un server care rulează pe nume de gazdă și ascultă cererile de conexiune pe port Returnează un mâner la o soclu deschisă care este gata pentru intrare și ieșire prin funcțiile I/O ale sistemului Unix Lista - arată codul pentru funcția open clientfd І /Іirting^ jfi 'funcţie auxiliară; care setează $inf^ int open clientfd(char *nume gazdă, port int) { int clientfd; struct host *hp; struct sockaddr in serveraddr; dacă ((clientfd = socket(AF INET, SOCK STREAM, )) h addr, (char *)&serveraddr sin addr s addr, hp->h length); serveraddr sin port = htons(port); optsprezece /* Stabiliți o conexiune la server */ dacă (connect(clientfd, (SA *) &serveraddr, sizeof(serveraddr)) int bind(int sockfd, struct sockaddr *my addr, int addrlen); Funcția bind îi spune nucleului să lege adresa socket-ului serverului din my addr la descriptorul sockfd Argumentul pentru funcția addrlen este valoarea sizeof(sockaddr in) funcția de ascultare Clienții sunt activi și inițiază cereri de conectare Serverele sunt pasive și așteaptă cereri de conectare de la clienți În mod implicit, nucleul presupune că mânerul construit de funcția socket corespunde unui socket activ care există la celălalt capăt al conexiunii Serverul apelează funcția de ascultare pentru a spune nucleului că handle-ul va fi folosit de server și nu de client #include int listen(int sockfd, int backlog); Funcția de ascultare convertește o soclu activă sockfd într-o soclu de ascultare care poate accepta cereri de conectare de la clienți Argumentul backlog este o indicație a numărului de cereri de conexiune pe care nucleul trebuie să le pună în coadă înainte de a respinge cereri O înțelegere precisă a argumentului întârzierii necesită un studiu detaliat al protocolului TCP/IP, care depășește scopul acestei cărți În viitor, îi vom atribui o valoare mare, de exemplu, funcția listenfd Să împachetăm funcțiile socket, bind și listen într-o funcție de ajutor numită open listenfd pe care serverul o poate folosi pentru a crea un handle de ascultare #include „csapp h” int open listenfd(int port); Funcția open listenfd se deschide și returnează un handle de ascultare care este gata să accepte cereri de stabilire a unei conexiuni pe un port Lista - arată codul pentru funcția open iistenfd După ce creăm descriptorul socket listenfd, folosim funcția setsockopt (nedescrisă aici) pentru a configura serverul astfel încât să poată fi oprit și apoi repornit imediat În mod implicit, un server repornit va refuza solicitările de conectare la client timp de aproximativ de secunde, ceea ce face depanarea foarte dificilă int open listenfd(int port) { int listenfd, optval=l; Partea a III-a Interacțiuni și relații cu programul struct sockaddr in serveraddr; cinci /* Creați un descriptor de socket */ dacă ((listenfd = socket(AF INET, SOCK STREAM, )) int accept(int listenfd, struct sockaddr *addr, int *addrlen); Funcția de acceptare așteaptă cererile de conectare de la clienții care vin în descriptorul de ascultător al funcției listenfd, apoi scrie Capitolul Programarea în rețea adresa socket-ului clientului în addr și returnează un handle legat care este folosit pentru a comunica cu clientul prin funcțiile I/O ale sistemului de operare Unix Diferențele dintre un descriptor de ascultare și un descriptor conectat derutează mulți studenți Descriptorul de ascultare servește ca punct final al solicitărilor de conectare ale clientului Este de obicei creat o singură dată și există pe durata de viață a serverului asociat Hranul de legătură este punctul final al conexiunii stabilite între client și server Este creat ori de câte ori serverul primește o solicitare de conectare și există doar pe durata ferestrei de service a clientului Pe fig Figura - arată rolurile atribuite ascultătorului și mânerelor de legare În pasul , serverul apelează funcția de acceptare, care așteaptă ca cererea de conectare să apară pe descriptorul de ascultare, pe care îl vom numi pentru specificitate descriptorul Reamintim că descriptorii - sunt rezervați fișierelor standard În pasul , clientul apelează funcția de conectare, care trimite o solicitare de conectare la funcția listenfd În pasul , funcția accept deschide un nou mâner asociat connfd (la care ne vom referi ca mâner ), stabilește o conexiune între clientfd și connfd și apoi returnează connfd-ul la aplicație Clientul revine de la funcția de conectare, iar din acel moment, clientul și serverul pot transfera date înainte și înapoi, citind și respectiv scris prin clientfd și connfd Orez Rolurile ascultării și mânerele conectate De ce există o diferență între ascultători și descriptori aferenti S-ar putea să vă întrebați de ce interfața prizei face o distincție între mânerele de ascultare și cele de conectare La prima vedere pare Partea a III-a Interacțiuni și relații cu programul o complicație inutilă Cu toate acestea, remedierea diferenței dintre acești doi descriptori este utilă, deoarece ne permite să construim servere paralele care sunt capabile să gestioneze mai multe conexiuni client în același timp De exemplu, ori de câte ori o solicitare de conexiune apare pe un handle de ascultare, putem bifurca un nou proces care comunică cu clientul prin intermediul handle-ului asociat Serverele paralele vor fi descrise mai detaliat în Capitolul Exemple de client Echo și server Echo Cel mai bun mod de a învăța despre interfața socket este să te uiți la exemple de cod Lista - arată codul clientului echo După ce stabilește o conexiune cu serverul, clientul intră într-o buclă în care citește în mod repetat linii de text de la intrarea standard, trimite o linie de text către server, citește o linie de ecou de pe server și trimite rezultatul la ieșirea standard Această buclă se întrerupe atunci când fgets primește un flag EOF de la intrarea standard, fie pentru că utilizatorul a tastat + pe linia de comandă, fie pentru că intrarea redirecționată conține linii de text sunt epuizate După ce bucla se termină, clientul închide mânerul Acest eveniment este raportat ca un flag EOF către server, pe care îl detectează atunci când primește un cod returnat de zero de la rio readlineb După ce clientul închide mânerul, acesta iese Când procesul se termină, nucleul clientului închide automat toate mânerele deschise, iar comanda de închidere de pe linia nu mai este necesară Cu toate acestea, o bună practică de programare necesită să închidem în mod explicit orice mâner pe care le-am deschis vreodată #include „csapp h” int main(int argc, char **argv) { int clientfd, port; caractere *gazdă, buf[MAXLINE]; rio t rio; opt dacă (argc != ) { fprintf(stderr, „utilizare: %s \n”, argv[ ]); ieșire( ); } , gazdă = argv[l]; port = atoi(argv[ ]); cincisprezece Capitolul Programarea în rețea clientfd = Open clientfd(gazdă, port); Rio readinitb(&rio, clientfd); optsprezece while (Fgets(buf, MAXLINE, stdin) != NULL) { Rio writen(clientfd, buf, strlen(buf)); Rio readlineb(&rio, buf, MAXLINE); Fputs(buf, stdout); } Close(clientfd); ieșire( ); } Lista arată programul principal al serverului echo Odată ce mânerul ascultătorului este deschis, acesta se află într-o buclă infinită Fiecare iterație a acestei bucle așteaptă o solicitare de conexiune din partea clienților, tipărește numele de domeniu și adresa IP a clientului conectat și apelează o funcție ecou care deservește clientul După ce programul ecou revine, programul principal închide mânerul asociat Imediat ce clientul și serverul închid mânerele respective, conexiunea este întreruptă #include „csapp h” void echo(int connfd); int main(int argc, char **argv) { int listenfd, connfd, port, clientlen; struct sockaddr in clientaddr; structura gazdă *hp; caractere *haddrp; dacă (argc != ) { fprintf(stderr, „utilizare: %s \n”, argv[ ]); ieșire( ); paisprezece } port = atoi(argv[l]); listenfd = Open listenfd(port); în timp ce ( ) { clientlen = sizeof(clientaddr); connfd = Accept(ascultă, (SA *)&clientaddr, &clientlen); /* determina numele domeniului si adresa IP a clientului */ hp = Gethostbyaddr((const char *)&clientaddr sin addr s addr, sizeof(clientaddr sin addr s addr), AF INET); Partea a III-a Interacțiuni și relații cu programul haddrp = inet ntoa(clientaddr sin addr); printf("server conectat la %s (%s)\n", hp->h name, haddrp); echo(connfd); Close(connfd); treizeci} ieșire( ); } Ce înseamnă semnul EOF la stabilirea unei conexiuni Ideea utilizării steagului EOF este adesea respinsă, mai ales în contextul conexiunilor Intemet În primul rând, trebuie să fim conștienți de faptul că nu există un caracter EOF Mai degrabă, EOF este o condiție care este detectată de nucleu O aplicație detectează o condiție EOF atunci când primește zero ca cod de returnare de la funcția de citire Pentru fișierele disc, condiția EOF apare atunci când poziția în fișierul curent depășește lungimea fișierului Pentru conexiunile Intemet, EOF apare atunci când un proces își închide capătul conexiunii Procesul de la celălalt capăt al conexiunii detectează EOF atunci când încearcă să citească ultimul octet din fluxul de octeți Rețineți că un simplu server echo poate servi doar un client la un moment dat Acest tip de server, care se uită la clienți pe rând, se numește server iterativ În Capitolul , vom vedea cum putem construi servere concurente mai complexe care pot deservi mai mulți clienți în același timp În cele din urmă, Lista arată codul unui program ecou care citește și scrie periodic linii de text până când funcția rio readlineb semnează sfârșitul fișierului pe linia |*,MD,*”'**,>V* ,,*G***V Fă-le îndrăznețe! este o comandă pentru a tipări textul între etichetele și cu caractere aldine Totuși, principalul avantaj al limbajului HTML este că pagina poate conține pointeri (linkuri hipertext) către conținutul stocat pe una dintre gazdele rețelei De exemplu, o linie HTML ca Carnegie Mellon este o comandă pentru a selecta obiectul text ''Camegie Mellon'' și a crea o legătură hipertext către un fișier HTML numit index html, care este stocat pe serverul Web CMU (Universitatea Carnegie-Melone) Dacă utilizatorul face clic pe obiectul text evidențiat, browserul va solicita fișierul HTML corespunzător de la serverul CMU și apoi îl va afișa pe ecran Originea World Wide Web World Wide Web a fost inventat de Tim Berners-Lee, un inginer de software la laboratorul de fizică elvețian ERN (Organizația Europeană pentru Cercetare Nucleară) În , Berners-Lee a publicat o notă în publicațiile științifice internaționale care propunea un sistem hipertext distribuit care să conecteze o rețea de noduri cu linii de date Scopul sistemului propus a fost de a ajuta oamenii de știință CERN să partajeze și să gestioneze informații La puțin peste doi ani după ce Berners-Lee a implementat primul server web și primul browser web, Web Partea a III-a Interacțiuni și relații cu programul a dezvoltat o mică rețea similară cu cea a CERN și a altor câteva site-uri Un eveniment fundamental a avut loc în , când Mark Andersen (Mats Andreesen) (care a fondat mai târziu Netscape) și colegii săi de la NCSA (Centrul Național pentru Aplicații de Supercomputing) au dezvoltat și implementat browserul grafic MOSA C pentru toate cele trei platforme majore: Unix, Windows și Macintosh Odată cu apariția browserului MOSAIC, interesul pentru Web a explodat, numărul de site-uri Web crescând de ori sau mai mult în fiecare an Până în , existau peste de milioane de site-uri web în lume (vezi raportul Netcraft Web Survey la www netcraft com) Conținut web Pentru clienții Web și servere Web, conținutul este o secvență de octeți cu un tip MIME (Multipurpose Internet Mail Extensions) asociat În tabel prezintă câteva tipuri MIME utilizate în mod obișnuit Tabelul Exemple de tipuri MIME Descriere tip MIME text/html Pagina HTML text/ simplu Text neformatat aplicație/document PostScript PostScript imagine/gif Afișare binar redată în format GIF imagine/gif jpeg Afișare binar redată în format JPEG Serverele web oferă conținut clienților în două moduri diferite: □ Preluați fișierul disc și returnați conținutul acestuia către client Acest fișier disc este conținut imuabil, procesul de livrare a fișierului către client se numește servire de conținut static □ Rulați executabilul și returnați rezultatul acestuia către client Ieșirea obținută din rularea executabilului se numește conținut dinamic, iar procesul de execuție a programului și livrarea ieșirii acestuia către client se numește servire dinamică de conținut Fiecare bucată de conținut returnată de serverul Web este asociată cu un fișier pe care îl gestionează Fiecare dintre aceste fișiere are un nume unic, numit indicator URL (Locator universal de resurse, Localizator uniform de resurse) De exemplu, adresa URL http://www aol com: /index html identifică un fișier HTML numit /index html pe gazda de internet www aol com, care este controlat de un server Web care ascultă pe portul Numarul portului Capitolul Programarea în rețea nu trebuie specificat, valoarea implicită este numărul portului HTTP URL-urile fișierelor executabile pot include argumente de program după numele fișierului Simbol? separă numele fișierului de argumente, iar fiecare argument este separat prin & De exemplu, adresa URL http://kittyhawk cmcLcs cmu edu: /cgi-bin/adder? & identifică un executabil numit /cdі-bin/adder care este apelat cu două șiruri de argumente: și Clienții și serverele folosesc diferite părți ale URL-ului în timpul procesării unei tranzacții De exemplu, clientul folosește prefixul http://www aol com: pentru a determina ce fel de server să contacteze, unde se află serverul și pe ce port ascultă Serverul folosește sufixul /index html pentru a căuta fișierul în sistemul său de fișiere pentru a determina dacă conținutul este solicitat, static sau dinamic Să evidențiem câteva puncte pe care trebuie să le înțelegeți pentru a interpreta corect sufixele URL □ Nu există reguli standard pentru a determina dacă o adresă URL se referă la conținut static sau dinamic Fiecare server are propriile reguli pentru fișierele pe care le manipulează Abordarea obișnuită este de a identifica un set de directoare, cum ar fi cgi-bin, în care ar trebui să fie stocate toate fișierele executabile □ Primul / din sufix nu înseamnă directorul rădăcină Unix Dimpotrivă, denotă directorul principal pentru orice tip de conținut solicitat De exemplu, serverul poate fi configurat astfel încât toate fișierele de conținut static să fie stocate în directorul /usr/httpd/html și toate fișierele de conținut dinamic să fie stocate în directorul /usr/httpd/cgi-bin □ Sufixul de lungime minimă al URL-ului este /, pe care toate serverele îl extind la o pagină de pornire standard, cum ar fi /index html Aceasta explică de ce devine posibilă extragerea paginii de pornire prin simpla introducere a numelui de domeniu în browser Acest browser adaugă / lipsă la adresa URL și îl transmite serverului, care extinde / la un nume de fișier standard Tranzacții HTTP Deoarece protocolul HTTP se bazează pe șiruri de text transmise prin conexiuni la Internet, putem folosi programul telnet Unix pentru a tranzacționa cu orice server Web prin Internet Programul telnet este foarte util la depanarea serverelor care comunică cu clienții prin trimiterea de șiruri de text prin conexiuni de rețea De exemplu, Lista - folosește telnet pentru a interoga pagina de pornire a serverului Web AOL VM-VU-Ts-VM; ' — " I^Listing ; Tranzacție H TP care servește conținut static ^ ^;| unix> telnet www aol com Client: conexiune deschisă Încerc Telnet imprimă linii către terminal Conectat la aol com Partea a III-a Interacțiuni și relații cu programul Caracterul de evacuare este „€]” GET /HTTP/ Client: Cerere șir gazdă: www aol com Client: antet HTTP/ necesar Client: Linia goală se termină antete HTTP/ OK Server: șir de răspuns MIME-Version: Server: urmează cinci anteturi de răspuns Data: Mop, ianuarie : : GMT Server: NaviServer/ AOLserver/ Tip de conținut: text/html Server: Se așteaptă HTML în corpul răspunsului Lungimea conținutului: Server: se așteaptă octeți în corpul răspunsului Server: șirul gol termină anteturile de răspuns Server: prima linie de HTML în corpul răspunsului Server: de linii de HTML nu sunt afișate Server: ultima linie de HTML în corpul răspunsului Conexiune închisă de gazdă străină Server: întrerupe conexiunea unix> Client: întrerupe conexiunea și se încheie Pe linia , rulăm programul telnet dintr-un shell Unix și solicităm o conexiune la serverul Web AOL Programul telnet tipărește trei linii de ieșire direcționate către terminal, deschide conexiunea și apoi așteaptă să introducem text (linia ) De fiecare dată când introducem un șir de text și apăsăm tasta Enter, telnet citește șirul, adaugă linii noi (\r\n în notație C) la sfârșit și trimite șirul la server Toate acestea sunt în concordanță cu standardul HTTP, care cere ca fiecare linie să se termine cu o pereche de returnări de cărucior și fluxuri de linie Pentru a iniția o tranzacție, introducem o solicitare HTTP (liniile - ) Serverul emite un răspuns HTTP (liniile - ) și apoi închide conexiunea (linia ) solicitări HTTP O solicitare HTTP constă dintr-un șir de interogare (linia ), care poate fi urmat sau nu de mai mult de un antet de cerere (linia ), urmat de un șir de text gol care completează lista de anteturi (linia ) Cererea arata ca HTTP acceptă o serie de metode diferite, inclusiv GET, POST, OPT ONS, HEAD, PUT, DELETE și TRACE Vom lua în considerare doar metoda GET cea mai frecvent utilizată, care, conform rezultatelor cercetării, stă la baza a cel puțin % din solicitările HTTP [ ] Metoda GET necesită ca serverul să genereze și să returneze conținut identificat printr-un URI (Uniform Resource Identifier) Identificator Capitolul Programarea în rețea URI-ul are un sufix corespunzător URL-ului, care include numele fișierului și argumente opționale Câmpul din șirul de interogare specifică versiunea HTTP cu care se potrivește interogarea Cea mai recentă versiune de HTTP este versiunea HTTP/ [ ] HTTP/ este versiunea anterioară, care a apărut în și este încă în uz astăzi [ ] Versiunea HTTP/ definește anteturi suplimentare care oferă suport pentru funcții mai avansate, cum ar fi securitatea, precum și un mecanism care permite unui client și server să efectueze mai multe tranzacții prin aceeași conexiune stabilită În practică, cele două versiuni de mai sus sunt compatibile deoarece clienții și serverele HTTP/ pur și simplu ignoră anteturile HTTP/ necunoscute Solicitarea de pe linia cere serverului să găsească și să returneze fișierul HTML /index html De asemenea, informează serverul că restul solicitării va fi în format HTTP/ Antetele cererii oferă serverului informații suplimentare, cum ar fi, de exemplu, marca comercială a browserului sau tipul MIME pe care browserul îl acceptă Antetele cererii arată ca : În scopul nostru, singurul antet pe care trebuie să-l luăm în considerare este antetul Host (linia ), care este returnat în cererile HTTP/ , dar nu și în cererile HTTP/ Antetul gazdă utilizează cache-uri proxy, care servesc uneori ca intermediar între browser și serverul de origine care manipulează fișierul solicitat Între client și serverul de origine, pot exista mulți intermediari în așa-numitul lanț intermediar (lanțul proxy) Datele din antetul gazdă, care identifică numele de domeniu al serverului de origine, permit intermediarului din mijlocul lanțului să determine o copie stocată în cache local a conținutului solicitat Revenind la exemplul nostru din Lista - , șirul de text gol afișat pe linia a programului (care este generat prin apăsarea de pe tastatură) termină anteturile și instruiește serverul să trimită fișierul HTML solicitat Răspunsuri HTTP Răspunsurile HTTP sunt similare cu cererile HTTP Un răspuns HTTP constă dintr-o linie de răspuns (linia din Lista ), urmată de antete de răspuns sau deloc (liniile - ), urmată de o linie goală care încheie secțiunea antet (linia ), urmată de răspunsul corp (liniile - ) Linia de răspuns arată ca Câmpul versiune indică versiunea HTTP căreia îi corespunde răspunsul Codul de stare este un număr întreg pozitiv din trei cifre care indică dispoziția cererii Mesajul de stare afișează echivalentul codului de eroare În tabel prezentat Partea a III-a Interacțiuni și relații cu programul o listă cu unele dintre cele mai frecvent utilizate coduri de stare și mesajele lor corespunzătoare Tabelul Codurile de stare a mediului HTTP Cod de stare Mesaj de stare Descriere mesaj OK Solicitarea a fost procesată fără erori Mutat permanent Conținutul a fost mutat la gazda numită în antetul Locație Solicitare greșită Solicitarea poate să nu fie înțeleasă de server Interzis Serverul nu a primit permisiunea de a accesa fișierul solicitat Nu a fost găsit Serverul nu a putut găsi fișierul solicitat Neimplementat Serverul nu acceptă metoda de solicitare Versiunea HTTP nu este acceptată Serverul nu acceptă versiunea specificată în cerere Antetele răspunsului de pe rândurile - din Lista - oferă informații suplimentare despre răspuns Pentru scopurile noastre, cele mai importante anteturi sunt Content-Type (tipul de conținut) (linia ), care spune clientului tipul MIME al conținutului din corpul răspunsului și content-Length (lungimea conținutului) (linia ), care oferă dimensiunea sa în octeți Un șir de text gol, plasat pe linia a programului care încheie secțiunea antet, este urmat de corpul răspunsului, care conține conținutul solicitat Difuzarea de conținut dinamic Dacă încetăm să ne gândim pentru un moment la modul în care un server poate oferi conținut dinamic unui client, apar anumite întrebări De exemplu, cum transmite clientul argumente programatice către server? Cum transmite serverul aceste argumente procesului generat pe care îl creează? Cum transmite serverul alte informații procesului generat de care ar putea avea nevoie pentru a genera conținutul solicitat? Unde își trimite procesul copil ieșirea? Toate aceste întrebări primesc răspuns de un standard de facto numit interfață Common Gateway Interface (CGI) Capitolul Programarea în rețea Cum transmite clientul argumentele programului către server Argumentele cererii GET sunt transmise în URI După cum știm deja, simbolul? separă numele fișierului de argumentele sale, iar fiecare argument este separat de restul argumentelor prin & Spațiile între argumente nu sunt permise și trebuie reprezentate ca % Există coduri similare pentru alte caractere speciale Trecerea de argumente în solicitările HTTP POST Argumentele pentru solicitările HTTP POST sunt transmise în corpul cererii, nu în URI Modul în care serverul transmite argumente procesului generat După ce serverul primește o solicitare like GET /cgi-bin/adder? & HTTP/ apelează funcția fork pentru a crea procesul copil și apelează funcția exec pentru a executa programul /cgi-bin/adder în contextul procesului copil Programele precum programul de adunare sunt adesea denumite programe CGI deoarece urmează regulile standardului CGI Și pentru că multe programe CGI sunt scrise ca scripturi Perl, programele CGI sunt adesea denumite scripturi CGI Înainte de a apela funcția exec e, procesul copil setează variabila șir de interogare CGI la & , la care programul de adunare se poate referi în timpul execuției folosind funcția Unix getenv în acest scop Modul în care serverul transmite alte informații procesului generat Standardul CGI definește numărul de variabile de mediu pe care un program CGI le poate seta în timpul rulării În tabel arată una dintre submulțimile unor astfel de variabile Tabelul Exemple de variabile de mediu CGI Descrierea variabilei de mediu QUERY STRING Argumente ale programului SERVER PORT Portul pe care ascultă procesul părinte REQUEST METHOD solicitări GET sau POST REMOTE HOST Nume de domeniu client REMOTE ADDR Adresa IP a clientului în notație zecimală punctată CONTENT TYPE only POST: corpul cererii are un MIME CONTENT LENGTH only POST: dimensiunea corpului cererii în octeți Partea a III-a Interacțiuni și relații cu programul Unde își trimite procesul generat rezultatul? Un program CGI își trimite conținutul dinamic la ieșire standard Înainte ca procesul copil să încarce și să execute programul CGI, acesta utilizează funcția Unix dup pentru a redirecționa ieșirea standard către handle-ul asociat asociat cu clientul corespunzător Prin urmare, orice scrie programul CGI la ieșirea standard este trimis direct către client Rețineți că, deoarece procesul părinte nu cunoaște tipul sau dimensiunea conținutului pe care procesul copil îl generează, este la latitudinea procesului copil să construiască anteturile răspunsului tip conținut și lungimea conținutului, precum și șirul gol care se termină secțiunea antet Lista - arată un program CGI simplu care adaugă două argumente și returnează clientului un fișier HTML care conține suma # include „csapp h” int main(void) { caractere *buf, *p; caractere argl[MAXLINE], arg [MAXLINE], conținut[MAXLINE]; int nl= , n = ; /* Extrage două argumente */ dacă ((buf = getenv("QUERY STRING") ) != NULL) { p = strchr(buf, '&'); *p = '\ '; strcpy(argl, buf); strcpy(arg , p+ ); nl = atoi(argl); n = atoi(arg ); } /* Construiți corpul răspunsului */ sprintf(conținut, „Bine ați venit la add com: „); sprintf(conținut, „%sPortalul de adăugare a internetului \r\n ”, conținut); sprintf(conținut, „%sRăspunsul este: %d + %d = %d\r\n ”, conținut, nl, n , nl + n ); sprintf(conținut, „%sMulțumesc pentru vizită!\r\n”, conținut); /* Creați răspuns HTTP */ printf("Lungimea conținutului: %d\r\n", strlen(conținut)); printf("Tipul conținut: text/html\r\n\r\n"); printf("%s", continut); Capitolul Programarea în rețea ffush(stdout); ieșire( ); } Lista - arată o tranzacție HTTP care reprezintă conținutul dinamic returnat de programul de adăugare G * I Listing^ ? №;GraShaktsy^ unix> telnet kittyhawk cmcl cs cmu edu Client: stabiliți conexiunea Încercând Conectat la kittyhawk cmcl cs cmu edu Caracterul de evacuare este GET /cgi-bin/adder? & HTTP/ Client: șir de interogare Client: linia goală se termină secțiunea antetului HTTP/ OK Server: șir de răspuns Server: Tiny Web Server Server: Identificare server Lungimea conținutului: Adder: așteaptă octeți în corpul răspunsului Tip de conținut: text/html Adder: așteaptă HTML în corpul răspunsului Adder: șirul gol termină secțiunea antetului Bine ați venit la add com: Portalul de adăugare pe Internet Totalizator: primul șir HTML Răspunsul este: + = Adder: a doua linie HTML în corp de răspuns Vă mulțumim pentru vizită! Adder: a treia linie de HTML în corpul răspunsului Conexiune închisă de gazdă străină Server: deconectat unix> Client: închide conexiunea și iese Trecerea de argumente în solicitările HTTP POST destinate programelor CGI Când faceți cereri POST, procesul copil trebuie, de asemenea, să redirecționeze intrarea standard către handle-ul asociat În acest caz, programul CGI citește argumentele în corpul cererii de la intrarea standard EXERCIȚIUL În sec În Secțiunea , v-am avertizat despre pericolele utilizării funcțiilor C I/O standard în aplicațiile de rețea În același timp, programul CGI prezentat în Lista - poate folosi I/O standard fără nicio problemă De ce? Dezvoltare server web mic TINY Încheiem discuția cu dezvoltarea unui program de rețea, care este un server Web mic, dar care funcționează bine, pe care îl vom Partea /// Interacțiuni și relații cu programul numele lor este MINUSUL (Minuscul) Serverul TINY este un program interesant din multe puncte de vedere Implementează multe dintre ideile pe care le-am învățat până acum, cum ar fi controlul proceselor, Unix I/O, interfața socket și protocolul HTTP, în doar de linii de cod Și, deși conține un minim de funcționalitate, îi lipsește în mod clar fiabilitatea și securitatea unui server real, cu toate acestea, are suficientă putere Vă recomandăm să îl studiați și să îl implementați pe cont propriu Este extrem de interesant să direcționezi un browser real către propriul său server și să urmărești cum afișează o pagină web complexă cu text și grafică pe ecran Programul principal de server TINY Lista - arată programul principal de server TINY TINY este un server iterativ care ascultă pe un port cererile de conexiune transmise pe linia de comandă După ce serverul TINY deschide un soclu de ascultare apelând funcția open listenfd, acesta trece printr-o buclă nesfârșită, tipică serverelor, acceptând în mod repetat cereri de conectare (linia ), executând tranzacții (linia ) și închizând capătul conexiunii (linia ) ) unu /* * tiny c - Un server web HTTP/ simplu iterativ care * folosește metoda GET pentru a servi statice și dinamice conţinut */ #include „csapp h” void doit(int fd); void read requestdrs (rio t *rp); int parse uri(char *uri, char *filename, char *cgiargs); void serve static(int fd, char *filename, int file size); void get filetype(char *filename, char *filetype); void serve dynamic(int fd, char *filename, char *cgiargs); void clienterror(int fd, char *cauza, char *errnum, char *shortmsg, char *longmsg); cincisprezece int main(int argc, char **argv) int listenfd, connfd, port, clientlen; struct sockaddr in clientaddr; douăzeci /* Verificați argumentele liniei de comandă */ if (argc != ) { fprintf(stderr, „utilizare: %s \n”, argv[ ]); Capitolul Programarea în rețea iesire(l); } port e atoi(argv[l]); listenfd = Open listenfd(port); în timp ce ( ) { clientlen » sizeof(clientaddr); connfd = Accept(ascultă, (SA *)&clientaddr, &clientlen); doit(connfd); Close(connfd); } } trebuie să funcţioneze Funcția doit prezentată în Lista - procesează o singură tranzacție HTTP În primul rând, citim și analizăm șirul de interogare (liniile - ) Observați cum folosim funcția rio readlineb prezentată în Listarea pentru a citi șirul de interogare Serverul TINY acceptă doar metoda GET Dacă clientul solicită o altă metodă (cum ar fi metoda POST), îi trimitem un mesaj de eroare și revenim la programul principal (liniile - ), care apoi închide conexiunea și așteaptă următoarea cerere de conectare În caz contrar, citim și (după cum vom vedea mai târziu) ignorăm orice antet de solicitare (linia ) ||ListingL L^^n^tsiyavtsіprlnyaѳpentru procesarea unei tranzacții 'r>D| void doit (int fd) { int este static; struct stat sbuf; caractere buf[MAXLINE], metoda[MAXLINE], uri[MAXLINE], versiune[MAXLINE]; caractere nume de fișier[MAXLINE], cgiargs[MAXLINE]; rio t rio; opt /* Citiți șirul de interogare și anteturile */ Rio readinitb(&rio, fd); Rio readlineb(&rio, buf, MAXLINE); sscanf(buf, „%s %s %s”, metoda, uri, versiune); dacă (strcasecmp(metoda, „GET”)) { clienterror(fd, metoda, „ ”, „Neimplementat”, „Tiny Server nu implementează această metodă”); întoarcere; } Partea a III-a Interacțiuni și relații cu programul read requestthdrs(&rio); nouăsprezece /* Analizarea URI-ului din cererea GET */ is static = parse uri(uri, filename, cgiargs); if (stat(nume fișier, &sbuf) Eroare mică ”); sprintf (corp, "%s \r\n", corp); sprintf(body, "%s%s: %s\r\n", body, errnum, shortmsg); sprintf(corp, ”%s %s: %s\r\n”, corp, longmsg, cauză); sprintf(body, „%s The Tiny Web Server \r\n”, body); /* Tipăriți răspunsul HTTP */ sprintf(buf, „HTTP/ %s %s\r\n”, errnum, shortmsg); Rio writen(fd, buf, strlen(buf)); sprintf(buf, „Tipul conținut: text/html\r\n”); Rio writen(fd, buf, strlen(buf)); sprintf(buf, „Lungimea conținutului: %d\r\n\r\n”, strlen(corp)); Rio scris(fd, buf, strlen(buf)); Rio scris(fd, corp, strlen(corp)); } Ca o reamintire, răspunsul HTML trebuie să specifice dimensiunea și tipul de conținut al corpului răspunsului Astfel, am ales să construim conținutul HTML ca o singură linie (în program, rândurile - ), astfel încât să putem determina cu ușurință dimensiunea acestuia (linia ) De asemenea, rețineți că folosim funcția robustă rio writen prezentată în Lista pentru toate ieșirile funcția read requestdrs Serverul TINY nu folosește niciuna dintre informațiile conținute în anteturile cererii Pur și simplu îl citește și îl ignoră apelând funcția read requesthdrs, prezentată în Lista - Rețineți faptul că șirul de text gol care termină secțiunea antetului cererii constă dintr-o pereche de întoarcere a căruciorului și avans de linie, pe care le verificăm pe linia Partea a III-a Interacțiuni și relații cu programul „Lista Funistsia^citeşte şi ignoră titlurile'^ void read requestdrs (rio t *rp) { charbuf[MAXLINE]; Rio readlineb(rp, buf, MAXLINE); while(strcmp(buf, "\r\n")) Rio readlineb(rp, buf, MAXLINE); întoarcere; nouă } funcția parse uri Serverul TINY funcționează din ipoteza că directorul principal pentru conținutul static este directorul său curent și că directorul principal pentru executabile este /cgi-bin Orice URI care conține șirul cgi-bin se presupune că denotă o solicitare de conținut dinamic Fișierul implicit este /home html Funcția parse uri, prezentată în Lista - , implementează aceste strategii Analizează URI-ul, extragând numele fișierului și un șir de argument CGI opțional din acesta Dacă este solicitat conținut static (linia ), ștergem șirul de argument CGI (linia ) și apoi convertim URI-ul într-o cale relativă Unix, cum ar fi /index html (liniile - ) Dacă URI-ul se termină cu / (linia ), atunci adăugăm numele de fișier implicit la sfârșit (linia ) Pe de altă parte, dacă cererea necesită conținut dinamic (linia ), extragem toate argumentele CG posibile (liniile - ) și convertim restul URI-ului într-un nume de fișier relativ Unix (liniile - ) int parse uri(char *uri, char *filename, char *cgiargs) { caractere *ptr; if (!strstr(uri, "cgi-bin")) { /* Conținut static */ strcpy(cgiargs, ""); strcpy(nume fișier, " "); strcat(nume fișier, uri); dacă (uri[strlen(uri)- ] == '/') strcat(nume fișier, "home html"); întoarcere ; } Capitolul Programarea în rețea else { /* Conținut dinamic */ ptr = index(uri, '?'); dacă (ptr) { strcpy(cgiargs, ptr+ ); *ptr = '\ '; optsprezece } altfel strcpy(cgiargs, ""); strcpy(nume fișier, " "); strcat(nume fișier, uri); întoarce ; } } funcția serve static Serverul TINY servește patru tipuri diferite de conținut static: fișiere HTML, fișiere text simplu și imagini codificate GIF și JPG Aceste tipuri de fișiere reprezintă cea mai mare parte a datelor statice difuzate pe Web Funcția serve static, prezentată în Lista - , trimite un răspuns HTTP al cărui corp conține conținutul unui fișier local Mai întâi determinăm tipul analizând sufixul numelui de fișier (linia ), apoi trimitem șirul de răspuns și anteturile de răspuns către client (liniile - ) Rețineți că secțiunea antet se termină cu o linie goală |^RistinM L^fu^|^iya^bslUui^etStatic(UesrHoldRdPosition RequestClient^-i laaX'aaa«rtotaae«f aaeaaeaaaaaotraeeeaaâevaaeeaoeee^aaaaaaaeeaeaMaaaaaaâaa^eb^aMaairriattaaaeeaaaatfaaieaaaaaaaba'a^eaaaaleaelae^eaeaiat eaaaaaaaaaaeaae»aaaaaaaeaae\aaaaaaaBaBaaaaaaaaeaaaaaaаааа ааааааааааааЬаааЛЪіій^авІ void serve static (int fd, char *filename, int file size) { int srcfd; caractere *srcp, tip de fișier[MAXLINE], buf[MAXBUF]; cinci /* Trimite antete de răspuns către client */ get filetype(nume fișier, tip fișier); sprintf(buf, "HTTP/ OK\r\n"); sprintf(buf, "%sServer: Tiny Web Server\r\n", buf); sprintf(buf, „%sLungimea conținutului: %d\r\n”, buf, dimensiunea fișierului); sprintf(buf, ”%sContent-type: %s\r\n\r\n”, buf, filetype); Rio writen(fd, buf, strlen(buf)); /* Trimite corpul răspunsului către client */ srcfd „Deschide (nume fișier, O RDONLY, ); srcp = Mmap( , file size, PROT READ, MAP PRIVATE, srcfd, ) ; Închidere(srcfd); Partea a III-a Interacțiuni și relații cu programul Rio writen(fd, srcp, file size); Munmap(srcp, file size); douăzeci } /* * Funcția get filetype extrage tipul fișierului din numele fișierului */ void get filetype(char *filename, char *filetype) { dacă (strstr(nume fișier, "" html")) strcpy(tip de fișier, „text/html”); else if (strstr(nume fișier, „ gif”)) strcpy(tip de fișier, „imagine/gif”); else if (strstr(nume fișier, "" jpg")) strcpy(tip de fișier, „imagine/jpeg”); altfel strcpy(tip de fișier, „text/plain”); } În continuare, trimitem corpul răspunsului prin copierea conținutului fișierului solicitat în fd atașat (liniile - ) Codul de program corespunzător conține o serie de subtilități, așa că ar trebui studiat cu atenție Linia deschide numele fișierului pentru citire și își primește mânerul Pe linia , funcția Unix mmap mapează fișierul solicitat într-o regiune a memoriei virtuale Amintiți-vă din discuția anterioară a funcției mmap din Sect că apelul funcției mmap mapează primii octeți de dimensiune a fișierului ai fișierului srcfd într-o zonă privată de numai citire a memoriei virtuale care începe la adresa srcp Odată ce mapăm fișierul în memorie, nu mai avem nevoie de mânerul acestuia, așa că închidem fișierul (linia ) Dacă nu facem acest lucru, apare posibilitatea unei scurgeri fatale de memorie Linia transferă de fapt fișierul către client Funcția rio writen copiază octeții de dimensiune a fișierului pornind de la celula srcp (care este, desigur, mapată la fișierul solicitat) la un descriptor asociat clientului Și, în sfârșit, linia eliberează zona de memorie virtuală alocată fișierului Acest lucru este necesar pentru a evita o posibilă scurgere fatală de memorie funcția serve dynamic Serverul TINY servește orice tip de conținut dinamic prin bifurcare la un proces copil și apoi executând programul CGI în contextul procesului copil Funcția dinamică de servire, prezentată în Lista - , începe să trimită un șir de răspuns care indică clientului că totul merge bine (liniile - ), împreună cu un antet de informații Server (liniile - ) Este responsabilitatea programului CGI să transmită restul răspunsului Rețineți că această operațiune nu este atât de stabilă pe cât ne-am dori Capitolul Programarea în rețea elos, deoarece nu prevede apariția unei anumite erori în timpul funcționării programului AND L true r & {Funcția;rservește conținutul dinamic al modelului client \n”, argv[ ]); ieșire( ); unsprezece } sscanf(argvfl], „%x”, &addr); inaddr s addr = htonl(addr); printf("%s\n", inet ntoa(inaddr)); cincisprezece ieșire( ); } SOLUȚIE^EXERCITUL #include „csapp h” int main(int argc, char **argv) { struct in addr inaddr; /* Adresă în ordinea octeților acceptată pe net */ Partea a III-a Interacțiuni și relații cu programul unsigned int adresa; /* Adresă în ordinea octeților acceptată pe gazdă */ if (argc !- ) { fprintf(stderr, „utilizare: %s \n”, argv[ ]); ieșire( ); unsprezece } dacă (inet aton (argv[l], &inaddr) =" ) app error("eroare inet aton"); addr « ntohl(inaddr s addr); printf(" x%x\n", adresa); ieșire( ); nouăsprezece } REZOLVATE ȘI E EXERCIȚIUL NIIIIIIA De fiecare dată când interogăm adresa gazdei aol com, lista adreselor Intemet care se potrivesc este returnată într-o ordine diferită, round-robin unix> /hostinfo aol com numele gazdă oficial: aol com adresa: adresa: adresa: unix" /hostinfo aol com numele gazdă oficial: aol com adresa: adresa: adresa: unix" /hostinfo aol com numele gazdă oficial: aol com adresa: adresa: adresa: Ordinea diferită a adreselor în diferite interogări DNS este numită și ciclul DNS Poate fi folosit pentru interogări de echilibrare a încărcăturii pe nume de domenii foarte utilizate EXERCIȚIUL DE SOLUȚIE Motivul pentru care I/O standard funcționează în programele CGI este că programele CGI care rulează într-un proces copil nu trebuie să închidă în mod explicit niciunul dintre fluxurile lor de intrare și ieșire Când un proces copil se termină, nucleul închide automat toate mânerele CAPITOLUL Programare în paralel □ Programare paralelă cu procese □ Programare paralelă cu multiplexare I/O □ Programare paralelă cu fire □ Variabile partajate în programele de flux □ Sincronizarea firelor cu semafore □ Server paralel bazat pe organizarea preliminară a procesării fluxului □ Alte probleme de concurență □ Reluați Circuitele logice de control sunt paralele dacă se suprapun în timp Acest fenomen universal, numit concurență, se manifestă la multe niveluri diferite în orice sistem informatic Exemplele familiare includ handlere de excepții hardware, procese și handlere de semnal Unix Până acum, concurența a fost considerată de autori în primul rând ca un mecanism folosit de nucleu pentru a executa mai multe aplicații Cu toate acestea, paralelismul nu se limitează la nucleu Poate juca un rol important în aplicațiile în sine De exemplu, am văzut deja situația în care gestionanții de semnal Unix au permis aplicațiilor să răspundă la evenimente asincrone, cum ar fi un utilizator care tastează + sau un program care accesează o regiune arbitrară a memoriei virtuale Paralelismul la nivel de aplicație este util și în alte domenii: □ Pe un sistem de calcul uniprocesor cu o singură unitate centrală de procesare (CPU), firele paralele sunt intercalate astfel încât doar un fir rulează efectiv pe CPU la un moment dat Cu toate acestea, există mașini cu multe procesoare, numite multiprocesoare, care rulează mai multe fire în același timp Pe astfel de mașini, uneori rulează aplicații paralele, împărțite în fire paralele Partea a III-a Interacțiuni și relații cu programul se stinge mult mai repede Acest lucru este deosebit de important atunci când lucrați cu baze de date mari și aplicații științifice □ Acces la dispozitivele I/O lente Când o aplicație așteaptă să sosească date de la un dispozitiv I/O lent, cum ar fi o unitate de disc, atunci nucleul menține CPU-ul în funcțiune prin executarea altor procese În mod similar, aplicațiile individuale pot exploata concurența prin intercalarea acțiunilor utile cu solicitările I/O □ Utilizatorii au nevoie de capacitatea de a efectua sarcini simultan (multitasking) De exemplu, poate doriți să redimensionați fereastra în timp ce imprimați un document Sistemele moderne de tip fereastră folosesc paralelismul în acest scop Ori de câte ori un utilizator solicită o operație (de exemplu, făcând clic pe un buton al mouse-ului), este creată o logică de control paralelă separată pentru a efectua operația □ Reduceți timpul de întârziere prin amânarea execuției Aplicațiile pot folosi uneori concurența pentru a reduce latența anumitor operațiuni prin întârzierea altor operațiuni, astfel încât acestea să poată rula în paralel De exemplu, un alocator de heap poate reduce latența operațiunilor individuale gratuite, îmbinându-le într-un fir paralel care rulează la o prioritate mai mică și consumă cicluri PAD gratuite pe măsură ce apar □ Serviciu de rețea pentru clienți Serverele de rețea iterative explorate în Capitolul nu sunt realiste, deoarece pot servi doar un client la un moment dat Astfel, un client lent poate refuza să servească alți clienți Pentru un server real despre care se poate aștepta să deservească sute sau mii de clienți pe secundă, este inacceptabil să existe un client lent care refuză serviciul altora O abordare mai avansată ar fi construirea unui server paralel care creează o logică de control separată pentru fiecare client Acest lucru permite serverului să deservească mulți clienți în paralel și împiedică clienții lenți să uzurpe serverul Aplicațiile care folosesc paralelismul la nivel de aplicație se numesc paralel Există trei abordări principale pentru construirea de programe paralele în sistemele de operare moderne: Procese - în această abordare, fiecare logică de control este un proces planificat și întreținut de kernel Deoarece procesele au spații de adrese virtuale separate, firele de execuție care trebuie să comunice între ele trebuie să utilizeze un fel de mecanism explicit de comunicare interprocesor (IRC) Multiplexarea I/O este o formă de programare paralelă în care programele de aplicație își programează în mod explicit propria logică de control în contextul unui singur proces Logică Capitolul Programarea în paralel sunt modelate ca mașini de stare pe care programul principal trece în mod explicit de la o stare la alta ca urmare a datelor care ajung pe descriptorii de fișiere Deoarece programul este un singur proces, toate firele au același spațiu de adrese Threadurile sunt scheme logice care rulează în contextul unui singur proces și sunt programate de nucleu Threadurile pot fi gândite ca o simbioză a celor două abordări descrise mai sus, programate de nucleu ca fire de procesare și partajând același spațiu de adrese virtuale ca firele de execuție mux I/O Acest capitol explorează trei tehnici diferite de programare paralelă Pentru a face discuția cât mai transparentă, autorii propun să lucrăm cu o singură aplicație stimulativă - cu o versiune paralelă a serverului reflectat iterativ (server echo) discutat în Sec Programare în paralel cu procese Cel mai simplu mod de a construi un program paralel este să construiți cu procese și să utilizați funcțiile familiare: fork, exec și waitpid De exemplu, o abordare naturală a construirii unui server paralel este de a accepta cererile de conectare a clientului într-un proces părinte și apoi de a crea un nou proces copil pentru a deservi fiecare client nou Pentru a ilustra acest lucru mai clar, să presupunem că avem doi clienți și un server care ascultă cererile de conexiune pe un handle de ascultare (să zicem ) Acum să presupunem că serverul primește o cerere de conexiune de la clientul și returnează un handle conectat (să zicem ), așa cum se arată în Figura Orez Pasul : Serverul acceptă o solicitare de conectare de la client La primirea unei cereri de conexiune, serverul forkează un proces copil care primește o copie completă a tabelului de identificare a serverului Procesul copil își închide copia a descriptorului de ascultare , iar procesul părinte își închide copia a descriptorului asociat , deoarece acestea nu mai sunt necesare Partea a III-a Interacțiuni și relații cu programul Această situație este prezentată în Fig , în care procesul generat este „ocupat” să servească un client clientfd Orez Pasul : Serverul creează un proces copil pentru a servi clientul Întrucât mânerele legate în procesul părinte și copilul indică aceeași intrare în tabelul de fișiere, este esențial ca procesul părinte să închidă copia mânerului legat În caz contrar, intrarea în tabelul de fișiere pentru descriptorul asociat nu va fi niciodată dezactivată, iar scurgerea de memorie rezultată va consuma în cele din urmă memoria disponibilă și va prăbuși sistemul Acum să presupunem că, după ce procesul părinte creează un proces pentru clientul , acceptă o nouă cerere de conexiune de la clientul și returnează un nou handle asociat (de exemplu, ), așa cum se arată în Figura clientfd Orez Pasul : Serverul acceptă o altă solicitare de conectare Procesul părinte creează apoi un nou proces care începe să-și servească clientul folosind mânerul asociat , așa cum se arată în Figura În acest moment, procesul părinte așteaptă următoarea cerere de conexiune, iar cele două procese nou create își servesc clienții respectivi în paralel Capitolul Programarea în paralel Connfd( ) Orez Pasul : Serverul generează un alt proces copil pentru a servi noul client Server paralel bazat pe proces Lista - arată codul pentru un server echo paralel bazat pe proces #include „csapp h” void echo (int connfd); void sigchld handler(int sig) cinci { în timp ce (waitpid (- , , WNOHANG) > ) ; întoarcere; nouă } int main (int argc, char **argv) { int listenfd, connfd, port, clientlen=sizeof (struct sockaddr in); struct sockaddr in clientaddr; cincisprezece dacă (argc != ) { fprintf(stderr, „utilizare: %s \n”, argv[ ]); ieșire( ); nouăsprezece } Partea a III-a Interacțiuni și relații cu programul port = atoi(argv[ ]); Semnal(SIGCHLD, sigchld handler); listenfd = open listenfd(port); în timp ce ( ) { connfd = Accept (ascultă, (SA *) &clientaddr, &clientlen); dacă (Fork() == ) { Închidere(ascultăfd); /* Procesul generat închide soclul de ascultare */ echo(connfd); /* Procesul generat servește clientului */ Close(connfd); /* Procesul generat închide conexiunea la client */ de ieșiri ( );/* Ieșiri de proces generate */ } Close(connfd); /* Procesul părinte închide conexiunea priză (important!) */ } } Există câteva lucruri interesante de remarcat despre acest server: □ De regulă, serverele rulează destul de mult timp, așa că este necesar să activați handlerul SIGCHLD, care generează așa-numitele procese zombie (liniile - ) Deoarece semnalele SIGCHLD se blochează în timpul execuției handler-ului SIGCHLD și deoarece semnalele Unix nu sunt puse în coadă, handlerul SIGCHLD trebuie să fie pregătit pentru a genera mai multe procese zombie □ Procesele părinte și secundare trebuie să își închidă copiile respective ale connfd (liniile și, respectiv, ) După cum sa menționat deja, acest lucru este deosebit de important pentru procesul părinte, care trebuie să își închidă copia mânerului asociat pentru a evita scurgerile de memorie □ Datorită numărului de referințe din intrarea tabelului fișierului socket, conexiunea cu clientul nu va fi întreruptă până când atât copiile confd ale procesului părinte, cât și ale copilului sunt închise Avantaje și dezavantaje ale utilizării proceselor Procesele au un model curat pentru partajarea informațiilor de stare între procesele părinte și cele secundare: tabelele de fișiere sunt partajate, dar spațiile de adrese ale utilizatorilor nu sunt A avea spații de adrese separate pentru procese este atât un avantaj, cât și un dezavantaj Este imposibil ca un proces să scrie accidental peste memoria virtuală a altui proces, ceea ce elimină o mulțime de erori evidente Acesta este un avantaj Pe de altă parte, spațiile de adrese separate îngreunează procesele să partajeze informații despre stare Pentru partajare Capitolul Programarea în paralel informații, trebuie să utilizeze mecanisme explicite de comunicare interprocesor Un alt dezavantaj al design-urilor bazate pe proces este că sunt mai lente din cauza supraîncărcării ridicate a managementului procesului și a comunicării între procesoare Unix IPC În acest text, cititorul a întâlnit deja câteva exemple de IPC (Interprocessor Communication) Funcția waitpid și semnalele Unix, discutate în Capitolul , sunt mecanisme IPC primitive care permit trimiterea de mesaje minuscule către procesele care rulează pe aceeași mașină gazdă Interfețele socket, descrise în Capitolul , sunt o formă importantă de IPC care permite proceselor de pe diferite mașini gazdă să schimbe fluxuri arbitrare de octeți Cu toate acestea, termenul Unix IPC este în general „rezervat” pentru o mare varietate de tehnici care permit proceselor să interacționeze cu altele care rulează pe aceeași mașină gazdă Vezi Stevens [ ] pentru detalii IMPORTANT; NI E După ce procesul părinte închide mânerul asociat pe linia a serverului paralel, procesul copil poate comunica în continuare cu clientul folosind copia sa a mânerului De ce? EXERCIȚIUL Dacă linia din Lista - , care închide mânerul asociat, ar fi eliminată, codul ar fi totuși corect în sensul că nu ar exista nicio scurgere de memorie De ce? Programare paralelă cu multiplexare I/O Să presupunem că sarcina este de a scrie un program de server echo pentru comenzile interactive pe care utilizatorul le introduce în intrarea standard În acest caz, serverul trebuie să răspundă la două evenimente I/O independente: □ clientul de rețea face o cerere de conectare; □ utilizatorul introduce o linie de comandă de la tastatură La ce eveniment ar trebui să fie așteptat mai întâi? Nicio alegere nu este perfectă Când așteptați o solicitare de conectare în acceptare, nu puteți răspunde la comenzile de intrare În mod similar, în timp ce așteptați o comandă de intrare în așteptare, nu puteți răspunde la nicio solicitare de conectare O soluție la această dilemă este o tehnică numită I/O multiplexare Idee cheie: Folosind funcția de selectare pentru a cere nucleului să păstreze un proces, returnând controlul aplicației numai după ce aceasta s-a manifestat Partea a III-a Interacțiuni și relații cu programul unul sau mai multe evenimente I/O, după cum se arată în următoarele exemple: □ reveni când orice descriptor din setul { , } este gata de citit; □ reveni când orice descriptor din setul { , , } este gata de scris; □ inactiv dacă au trecut , secunde în timp ce se așteaptă un eveniment I/O Aici va fi luat în considerare doar primul scenariu: așteptarea unui set de descriptori care să fie pregătiți pentru citire O discuție detaliată este prezentată în [ ], [ ] #include #include int select(int n, fd set *fdset, NULL, NULL, NULL); FD ZERO (fd set *fdset); /* Ștergeți toți biții din fdset */ FD CLR (int fd, fd set *fdset); /* Ștergeți bitul fd din fdset */ FD SET (int fd, fd set *fdset); /* Acces bit fd în fdset */ FD ISSET (int fd, fd set *fdset); /* Este bitul fd pe fdset */ Funcția select manipulează seturi de tip fd set, cunoscute sub numele de seturi de descriptori În mod logic, setul de descriptori este tratat ca o mască de bit de dimensiune și: bn-\) •••, b\, bo Fiecare bit al bk corespunde unui descriptor k Descriptorul k este membru al setului de descriptori dacă bk = Utilizatorului i se permite doar să efectueze următoarele operații pe seturile de descriptori: □ postați-le; □ atribuie unei variabile de un tip dat altuia; □ modificați și inspectați-le folosind macrocomenzile FD ZERO, FD SET, FD CLR și FDJSSET În scopul acestui capitol, funcția select se întinde pe două intrări: setul de descriptori fdset, numit setul de intrare și numărul n de elemente ale setului de intrare Funcțiile de selectare se blochează până când cel puțin un descriptor din setul de citire este gata pentru a fi citit Un handle to este gata pentru a fi citit numai dacă o solicitare de citire a unui singur octet din acest handle nu este blocată Ca efect secundar, funcția select modifică fd set pentru a indica un subset al setului citit, numit setul gata Valoarea de returnare a funcției indică numărul de elemente (valoarea cardinală) din setul citit Rețineți că setul de citire trebuie actualizat de fiecare dată când selectați este apelat Cel mai bun mod de a înțelege funcția select este de a studia exemple specifice Lista - arată cum select poate fi folosit pentru a implementa un server echo iterativ care acceptă comenzile utilizatorului la intrarea standard Capitolul Programarea în paralel #include „csapp h” void echo (int connfd); void comanda (void); int main (int argc, char **argv) { int listenfd, connfd, port, clientlen s sizeof (struct sockaddr in); struct sockaddr in clientaddr; fd set read set, ready set; dacă (argc !s ) { fprintf(stderr, „utilizare: %s \n”, argv[ ]); ieșire( ); paisprezece } port = atoi(argv[ ]); listenfd = Open listenfd(port); FD ZERO(&read set); FD SET(STDIN FILENO, &read set); FD SET(ascultăfd, &read set); în timp ce ( ) { ready set = read set; Selectați(ascultăfd+ , &ready set, NULL, NULL, NULL); dacă (FD-ISSET (STDIN FILENO, &ready set)) comanda(); /* citește linia de comandă din stdin */ dacă (FD ISSET (ascultă, &ready set)) { connfd = Accept (ascultă, (SA *) &clientaddr, ficlientlen); echo(connfd); /* ecou intrarea clientului înainte de sfârșitul fișierului (EOF) */ treizeci} } } void command (void) { charbuf[MAXLINE]; dacă (!Fgets (buf, MAXLINE, stdin)) ieșire( ); /* Sfârșitul fișierului */ printf("%s",buf); /* Procesează comanda de intrare */ } Începem prin a folosi funcția deschisă listenfd prezentată în Lista - pentru a deschide un handle de ascultător (linia din Listarea - ), urmată de utilizarea FD ZERO pentru a crea un set de citire gol (Figura - ) Partea a III-a Interacțiuni și relații cu programul listenfd stdin read set( ): | | | | | Orez Crearea unui set gol În continuare, rândurile - din Lista - definesc un set de citire pentru compoziția descriptorului (intrare standard) și a descriptorului (descriptor de ascultare) (Figura - ) listenfd stdin read set({ , }): | | | | | Orez Mâner de ascultare În acest moment, începe ciclul tipic de server Cu toate acestea, în loc să aștepte o solicitare de conectare, apelul de acceptare apelează funcția select, care se blochează până când mânerul ascultătorului sau intrarea standard este gata de citit (linia ) De exemplu, există o valoare ready set care va fi returnată de funcția select dacă utilizatorul apasă tasta enter și astfel pregătește descriptorul de intrare standard pentru citire (Figura ) listenfd stdin read set({ }): | | ~ | | | Orez Mâner de intrare standard După revenirea selectării, macro-ul FD ISSET este utilizat pentru a determina ce descriptor este gata de citit Dacă intrarea standard este gata (linia ), atunci este apelată funcția de comandă, care citește, analizează și reacționează la comandă înainte de a reveni la procedura principală Dacă mânerul de ascultare este gata (linia ), atunci funcția accept este apelată pentru a obține mânerul asociat, după care este apelată funcția echo, ecou fiecare linie a programului client până când clientul își închide capătul conexiunii Deși acest program este un caz de utilizare bun pentru funcția de selectare, nu este lipsit de defecte Problema este că după conectarea la client, acesta continuă să ecou liniile de intrare până când clientul își închide capătul conexiunii Astfel, dacă o comandă este introdusă la intrarea standard, niciun răspuns nu va fi primit până când serverul nu a terminat de deservit clientul O abordare mai bună ar fi multiplexarea în celule mai mici care reflectă (cel mult) o linie de text de fiecare dată când trece prin bucla de server (vezi exercițiul ) Capitolul Programarea în paralel Server paralel bazat pe multiplexarea I/O Multiplexarea I/O poate fi folosită ca bază pentru programele concurente bazate pe evenimente în care firele de execuție se mișcă ca urmare a anumitor evenimente Ideea generală este de a modela circuitele logice ca automate finite În mod informal, o mașină de stări este un set de stări, evenimente de intrare și tranziții care mapează stările și evenimentele de intrare la stări Fiecare tranziție mapează o pereche (stare de intrare, eveniment de intrare) la o stare de ieșire O buclă într-un grafic este o tranziție între aceeași stare de intrare și de ieșire Mașinile de stări sunt de obicei descrise ca grafice direcționate, unde nodurile reprezintă stări, arcurile direcționate reprezintă tranziții, iar etichetele arcului reprezintă evenimente de intrare Mașina de stări începe execuția într-o stare inițială Fiecare eveniment de intrare declanșează o tranziție de la starea curentă la starea următoare Pentru fiecare nou client k, serverul paralel I/O-multiplex creează o nouă mașină de stare sk și o asociază cu mânerul asociat dk După cum se arată în fig După cum se arată în Figura , fiecare mașină de stări sk are o stare (se așteaptă citirea descriptorului dk), un eveniment de intrare (descriptorul dk gata de a fi citit) și o tranziție (citirea unui șir de text din descriptorul d£) Cu funcția de selectare, serverul utilizează multiplexarea I/O pentru a detecta apariția evenimentelor de intrare Pe măsură ce fiecare descriptor asociat devine gata pentru a fi citit, serverul efectuează o tranziție pentru dispozitivul final corespunzător, caz în care citind și reflectând șirul de text din descriptor Citiți șirul de text ropd* Intrare: „descrig este gata pentru chі Orez Mașină de stări pentru logică într-un server Echo comandat de evenimente paralel Lista prezintă cod exemplu pentru un server paralel bazat pe multiplexarea I/O Mai mulți clienți activi sunt menținuți în structura pooI (liniile - ) După ce pool-ul este inițializat prin apelarea init pool (linia ), serverul intră într-o buclă infinită În timpul fiecărei iterații a acestei bucle, serverul apelează funcția select pentru a detecta două tipuri diferite de evenimente de intrare: o cerere de conexiune de la un client nou și Partea a III-a Interacțiuni și relații cu programul handle asociat pentru un client existent, gata de citit Când se primește o cerere de conectare (linia ), serverul deschide conexiunea (linia ) și apelează funcția add client pentru a adăuga clientul la magazin (linia ) În cele din urmă, serverul apelează funcția check client pentru a afișa o linie de text din fiecare handle asociat pregătit (linia ) #include „csapp h” typedef struct { /* reprezintă depozitul de descriptori asociați */ int maxfd; /*cel mai mare descriptor din read set */ fd set read set; /* set de toate manerele active */ fd set ready set; /* subset de descriptori gata de citire */ int gata; /* numărul de descriptori pregătiți din selectare */ int maxi; /* pointer "nivel critic" către matricea client */ int clientfd [FD-SETSIZE]; /* set de manere active */ rio t clientrio [FD SETSIZE]; /* set de buffer-uri de citire active */ }poo ; int byte cnt = ; /♦ numără numărul total de octeți primiți Server */ paisprezece int main (int argc, char **argv) } int listenfd, connfd, port, clientlen = sizeof(struct sockaddr in); struct sockaddr in clientaddr; bazin static douăzeci dacă (argc != ) { fprintf(stderr, „utilizare: %s \n”, argv[ ]); ieșire( ); } port = atoi(argv[ ]); listenfd = open listenfd(port); init pool(ascultăfd, &pool); în timp ce ( ) { /* Așteptați ascultarea/mânerele asociate */ de piscine ready set = pool read set; pool nready = Select (pool maxfd+ , &pool ready set, NULL, NULL, NULL); /* Dacă mânerul de ascultare este gata, adăugarea unui nou client a conduce */ dacă (FD ISSET (ascultare, &pool ready set)) { connfd = Accept (ascultă, (SA *)&clientaddr, &clientlen); Capitolul , Programarea în paralel add client(connfd, &pool); } /* Reflectează un șir de text din fiecare descriptor de link pregătit */ check clients(&pool); } } Funcția init j)ool (Listarea - ) inițializează unitatea client Matricea clientfd reprezintă un set de mânere conectate, unde - indică segmentul de memorie disponibil Inițial, setul de descriptori legați este gol, iar descriptorul ascultător este singurul descriptor din setul de citire selectat (liniile - ) void init pool (int listenfd, pool *p) { /* Inițial fără descriptori asociați */ int i; p->maxi = - ; pentru (i= ; i clientfd [i] = - ; opt /* Inițial, listenfd este singurul membru al setului de citire selectat */ p->maxfd = listenfd; FD ZERO (&p ->read set); FD SET (ascultare, &p->read set) ; } Funcția add client (Listarea - ) adaugă un nou client la pool-ul de clienți activ La găsirea unui segment gol în matricea clientfd, serverul adaugă descriptorul asociat la matrice și inițializează tamponul de citire RIO corespunzător, astfel încât rio readlineb să poată fi apelat pe descriptor (liniile - ) Descriptorul asociat este apoi adăugat la setul de citire selectat (linia ) și unele dintre proprietățile globale ale acumulatorului sunt actualizate Variabila maxfd (liniile - ) ține evidența celui mai mare descriptor de fișier pentru selectare Variabila maxi (liniile - ) ține evidența celui mai mare pointer către matricea clientfd, astfel încât funcțiile de verificare a ciients să nu fie nevoite să caute prin întreaga matrice ESTINGIS ? Adăugați ^rloNi^client nou dodkl^Vdya:^^^ arva"in LL'""La№""""a"a""VL"*a*a*a"Dі*a""*iI*"ai"IG"aPk "av" "a"e"aavv'""Oa*"a""vѵi"a"*a""""e""*v"""oYes"La nready- -; pentru (i = ; i clientfd [i] clientfd [i] = connfd; Rio readinitb(&p->clientrio[i], connfd); /* Adăugați un mâner la setul de mânere */ FD SET (connfd, &p->read set); /* Actualizați descriptorul maxim și marcajul „nivel critic” al unității */ dacă (connfd > p->maxfd) p->maxfd = connfd; dacă (i>p->maxi) p->maxi = i; pauză; douăzeci } dacă (i = = FD SETSIZE) *Nu se poate găsi segmentul gol */ app error(„eroare add client: Prea mulți clienți”); } Funcția de verificare a clientului (Listarea ) ecou șirul de text din fiecare descriptor asociat pregătit Dacă citirea șirului de text din descriptor reușește, atunci acel șir este reflectat înapoi către client (liniile - ) Rețineți că linia menține un număr cumulativ al tuturor octeților primiți de la toți clienții Dacă este detectat un EOF deoarece clientul și-a închis capătul conexiunii, atunci închidem capătul conexiunii (linia ) și scoatem mânerul din magazin (liniile - ) I^istingL GUservices" connection 'iuiț ento$^r' maxi) && (p->nready > ); i++) { connfd = p->clientfd[i]; rio = p->clientrio[i]; /* Dacă descriptorul este gata, reflectă un șir de text din el */ dacă ((connfd > ) && (FD ISSET (connfd, &p->ready set))) { p->nready- -; dacă ((n = Rio readlineb (&rio, buf, MAXLINE)) != ) { byte cnt += n; Capitolul Programarea în paralel printf ("Serverul a primit %d (%d total) octeți pe fd %d\n", n, byte cnt, connfd); Rio writen(connfd, buf, n); nouăsprezece } douăzeci /* Sfârșitul fișierului detectat (EOF), descriptor eliminat din acumulator */ altfel { Close(connfd); FD CLR (connfd, &p->read set); p->clientfd [i] = - ; } } } } În ceea ce privește modelul de stare finală, funcția select detectează evenimentele de intrare, iar funcția add ciient creează un nou circuit logic (mașina de stări) Funcția check ciient efectuează tranziții de stare prin oglindirea șirurilor de intrare și, de asemenea, elimină această mașină de stare atunci când clientul oprește trimiterea șirurilor de text Avantaje și dezavantaje ale multiplexării I/O Serverul prezentat în fig este un exemplu perfect al avantajelor și dezavantajelor programării bazate pe evenimente bazate pe multiplexarea de intrare și ieșire Un avantaj este că proiectarea bazată pe evenimente oferă programatorilor mai mult control asupra comportamentului programelor lor decât proiectarea bazată pe procese De exemplu, ne putem imagina scrierea unui program de server paralel bazat pe evenimente care oferă servicii preferențiale anumitor clienți, ceea ce ar fi dificil pentru un server paralel bazat pe proces Un alt avantaj este că un server comandat de evenimente bazat pe multiplexarea I/O rulează în contextul unui singur proces, prin urmare fiecare logică are acces la întreg spațiul de adrese ale procesului Acest lucru facilitează partajarea datelor între fire Un avantaj asociat cu rularea ca un singur proces este că serverul paralel poate fi depanat ca orice program serial folosind un instrument de depanare familiar, cum ar fi GDB În cele din urmă, proiectele bazate pe evenimente sunt adesea semnificativ mai eficiente și mai performante decât cele bazate pe proiecte, deoarece nu necesită o schimbare a contextului procesului pentru a programa un nou thread Un dezavantaj semnificativ al design-urilor bazate pe evenimente este complexitatea codificării De exemplu, considerat a fi condus de evenimente paralele Partea a III-a Interacțiuni și relații cu programul un server echo necesită de trei ori mai multă codare decât un server bazat pe procese și, din păcate, această complexitate crește pe măsură ce gradul de paralelizare a proceselor scade Paralelizarea se referă aici la numărul de instrucțiuni executate de fiecare circuit logic într-o perioadă de timp De exemplu, în serverul paralel luat în considerare, gradul de paralelizare este numărul de comenzi necesare pentru a citi un întreg șir de text În timp ce un anumit circuit logic citește un șir de text, niciun alt circuit logic nu poate „mișca mai departe” Acest lucru este grozav pentru un exemplu, dar lasă serverul bazat pe evenimente vulnerabil la clienții rău intenționați care trimit doar o parte din șirul de text și apoi opresc procesul Modificarea unui server bazat pe evenimente pentru a gestiona șiruri de text parțiale nu este trivială, dar se face automat printr-un proiect bazat pe proces EN ȘI E Pe majoritatea sistemelor Unix, tastarea + indică sfârșitul unui fișier la intrarea standard Ce se întâmplă dacă tastați + în programul afișat în Lista - în timp ce acesta este blocat de un apel de selectare? EXERCIȚIUL Programul server prezentat în Lista - are mare grijă când reinițializează variabila pool ready set chiar înainte de fiecare apel pentru a selecta De ce? Programare în paralel cu fluxuri Până acum, autorii au luat în considerare două abordări ale creării circuitelor logice paralele Prima abordare folosește un proces separat pentru fiecare schemă Nucleul programează automat fiecare proces Fiecare proces are propriul său spațiu de adrese private, ceea ce face dificilă partajarea datelor de către logică În a doua abordare, autorii își creează propria logică și folosesc multiplexarea I/O pentru a programa în mod explicit firele de execuție Deoarece există un singur proces, firele de execuție partajează întreg spațiul de adrese Această secțiune introduce o a treia abordare bazată pe fire care este un hibrid dintre primele două Un fir este o diagramă logică care rulează în contextul unui proces Până acum, programele descrise în carte au conținut un fir per proces Cu toate acestea, sistemele moderne vă permit să scrieți programe cu mai multe fire în paralel într-un singur proces Fiecare fir are propriul său context, inclusiv un identificator unic de numere întregi T D, stivă, indicator de stivă, contor de program, registre de uz general și coduri de condiție Toate firele care se execută într-un proces partajează întregul spațiu de adrese virtuale al procesului respectiv Capitolul Programarea în paralel Logica bazată pe fire combină calitățile firelor bazate pe proces și multiplexarea I/O Ca și procesele, nucleul programează automat firele de execuție și le recunoaște după ID-ul lor întreg La fel ca logica de multiplexare I/O, mai multe fire rulează în contextul unui singur proces și partajează întregul conținut al spațiului de adrese virtuale al unui proces, inclusiv codul, datele, bibliotecile partajate și fișierele deschise Model de executie a firului Modelul de execuție pentru mai multe fire este oarecum similar cu modelul de execuție pentru mai multe procese Luați în considerare exemplul din fig Timp Flux (principal) Flux (Peer to Peer) } Comutare context Comutare de context Comutare de context Orez Rularea unui fir paralel Fiecare proces își începe existența ca un singur fir, numit firul principal La un moment dat, firul principal creează un fir peer, iar din acel moment, cele două fire rulează în paralel Controlul trece în curând la firul peer prin comutatorul de context deoarece firul principal execută un apel de sistem lent, cum ar fi citire sau repaus, sau este întrerupt de intervalul de timp al sistemului Firul peer se execută puțin înainte de punctul în care controlul este transmis înapoi la firul principal Execuția firelor diferă de procese în mai multe moduri importante Deoarece contextul firului de execuție este mult mai mic decât contextul procesului, comutatorul contextului firului de execuție este mai rapid decât comutatorul contextului procesului O altă diferență este că, spre deosebire de procese, firele de execuție nu sunt organizate într-o ierarhie rigidă părinte-copil Firele asociate cu un proces formează un acumulator de proces peer Firul principal diferă de alte fire doar prin faptul că rulează întotdeauna primul într-un proces Impactul principal al acumulatorului de proces peer este că un fir poate Partea a III-a Interacțiuni și relații cu programul omorâți orice fir de execuție sau așteptați ca oricare dintre firele de execuție să se finalizeze Mai mult, fiecare proces peer poate citi și scrie aceleași date partajate Fire de interfață a sistemului de operare Posix Posix threads este o interfață standard pentru manipularea thread-urilor din programele C A fost adoptată în și este disponibilă pe majoritatea sistemelor Unix Posix definește aproximativ de funcții care permit programelor să creeze, să distrugă și să colecteze fire de execuție, să partajeze în siguranță date cu firele de execuție similare și să notifice firele de execuție egale cu privire la modificările stării sistemului Lista prezintă un program simplu de fir Posix Firul principal creează un fir peer și așteaptă să se termine execuția acestuia Firul peer tipărește șirul „Bună, lume!\n” și iese Când firul principal detectează că firul de execuție peer s-a terminat, acesta încheie procesul apelând exit W>' [Listarea Fire Posix /Y N'-a x ! #include „csapp h” void *thread (void *vargp); int main() cinci { pthread t tid; Pthread create(&tid, NULL, thread, NULL); Pthread join(tid, NULL); exit( ); } unsprezece void *thread (void *vargp)/* thread routine */ { prontf(”Bună, lume!\n”); returnează NULL; } Acesta este primul program de streaming pe care îl luăm în considerare, așa că îl vom analiza mai detaliat Codul și datele locale pentru un fir sunt încapsulate într-o rutină de fir După cum se arată în prototipul de pe linia , fiecare rutină de fir primește un pointer generic ca intrare și returnează un pointer generic Dacă trebuie să treceți mai multe argumente procedurii de rutină, trebuie să plasați argumentele într-o structură și să treceți un pointer către structură În mod similar, dacă rutina trebuie să returneze un flux de mai multe argumente, puteți returna un pointer către structură Capitolul Programarea în paralel Linia marchează începutul codului pentru firul principal Firul principal declară o variabilă locală tid, care va fi folosită pentru a stoca ID-ul firului de execuție (linia ) Firul principal creează un nou fir peer apelând funcția pthread create (linia ) Când apelul la pthread create revine, firul principal și firul peer nou creat rulează în paralel, iar tid conține ID-ul noului fir Firul principal așteaptă ca firul de execuție peer să se termine cu apelul pthread join pe linia În cele din urmă, firul principal apelează exit (linia ), care termină toate firele din procesul care se execută în prezent (doar firul principal în acest caz) Liniile - definesc rutina firului de execuție pentru firul egal Aceasta pur și simplu tipărește o linie, după care execuția firului egal se termină cu instrucțiunea return de pe linia Crearea de fire Unele fire creează altele apelând funcția pthread create: #include typedef void * (func) (void *); int pthread create (pthread t *tid, pthread attr t *attr, func *f, void *arg); Funcția pthread create creează un fir nou și rulează rutina firului de execuție în contextul noului fir de execuție cu argumentul de intrare arg Argumentul attr poate fi folosit pentru a schimba atributele implicite ale unui flux nou creat Modificarea acestor atribute este în afara domeniului de aplicare al cărții Când pthread create revine, argumentul tid conține ID-ul firului nou creat Un fir nou își poate determina propriul ID de fir apelând funcția pthread self #include pthread t pthread self(void); Terminarea firelor Un fir de execuție încheie execuția în următoarele moduri: □ implicit la returnarea unei rutine de nivel înalt; □ în mod explicit apelând funcția pthread exit, care apelează un pointer către valoarea returnată a thread return Dacă firul principal apelează pthread exit, așteaptă finalizarea altor fire de execuție, apoi iese din firul principal și din întregul proces cu valoarea returnată a firului return: Partea a III-a Interacțiuni și relații cu programul #include int pthread exit (void *thread return); □ un fir peer apelează funcția exit& Unix, care încheie execuția procesului și a tuturor firelor asociate acestuia; □ un alt thread peer abandonează firul curent apelând funcția pthread cancel cu ID-ul firului curent: #include int pthread cancel(pthread t tid); Unele fire așteaptă ca altele să termine de execuție apelând funcția pthread join: #include int pthreadjoin(pthread t tid, void **thread return); Funcția pthread join se blochează până când thread-ul se termină, atribuie pointerul (void *) returnat de procedura thread-ului la locația specificată de thread return și apoi colectează („recoltesează”) resursele de memorie deținute de firul întrerupt Rețineți că, spre deosebire de funcția de așteptare Unix, pthread join poate aștepta doar ca un anumit thread să se termine Nu puteți „instrui” pthread wait să aștepte ca un fir arbitrar să încheie execuția Acest lucru poate complica codul forțând alte mecanisme, mai puțin intuitive, să detecteze terminarea procesului Și Stevens afirmă destul de convingător că aceasta este o eroare în specificație [ ] Separarea firelor În orice moment, un flux este îmbinat sau împărțit Firul care este îmbinat poate fi colectat și distrus de alte fire Resursele sale de memorie (cum ar fi stiva) nu sunt eliberate până când nu este colectată de un alt fir În schimb, un fir detașat nu poate fi colectat sau distrus de alte fire Când execuția se încheie, resursele sale de memorie sunt eliberate automat de sistem Fluxurile sunt create fuzionate în mod implicit Pentru a evita scurgerile de memorie, fiecare fir care trebuie îmbinat trebuie fie colectat (comprimat) în mod explicit de un alt fir, fie separat printr-un apel la funcția pthread detach #include int pthread detach(pthread t tid); Funcția pthread detach detașează tid-ul de îmbinat Threadurile se pot detașa prin apelarea funcției pthread detach cu argumentul pthread self() Capitolul Programarea în paralel Deși unele dintre exemple vor folosi fluxuri îmbinate, există motive întemeiate pentru ca programele din lumea reală să folosească fluxuri împărțite De exemplu, un server Web de înaltă performanță ar putea crea un fir de execuție peer nou de fiecare dată când primește o solicitare de conectare de la un browser Web Deoarece fiecare conexiune este gestionată independent de un fir separat, nu este necesar – sau chiar de dorit – ca serverul să aștepte în mod explicit ca fiecare fir de execuție să se oprească În acest caz, fiecare fir peer trebuie să se separe înainte de a începe procesarea cererii, astfel încât resursele sale de memorie să poată fi reutilizate când firul de execuție se termină Inițializarea firului Funcția pthread once vă permite să inițializați starea asociată cu o rutină thread: #include pthread once t once control e PTHREAD ONCE INIT; int pthread pnce(pthread once t *once control, void (*init routine) (void)); Variabila once controi este globală sau statică și este întotdeauna inițializată la valoarea pthread once unit Prima dată când pthread once este apelat cu argumentul once control, rulează init routine, o funcție fără argumente de intrare care nu returnează nimic Apelurile ulterioare la pthread once cu argumentul pthread once nu fac nimic Funcția pthread once este utilă ori de câte ori trebuie să inițializați dinamic variabilele globale partajate de mai multe fire Un exemplu va fi discutat în Sect Server paralel bazat pe fire Lista - arată codul pentru un server echo paralel bazat pe fire Structura generală este similară cu un proiect bazat pe proces Firul principal așteaptă în mod repetat o solicitare de conexiune și apoi creează un fir peer pentru a gestiona cererea Codul pare simplu, dar există câteva puncte comune și, într-o anumită măsură, gâdilatoare cărora ar trebui să li se acorde o atenție deosebită [Listing Server de ecou paralel bazat pe fluxurile r; , ; d L l ^ g l l ' ; #include „csapp h” void echo (int connfd); Partea a III-a Interacțiuni și relații cu programul void *thread (void *vargp); cinci int main (int argc, char **argv) int listenfd, *connfdp, port, clientlen=sizeof (struct sockaddr in); struct sockaddr in clientaddr; pthread tid unsprezece dacă (argc != ) { fprintf(stderr, „utilizare: &s \n”, argv[ ]); ieșire( ); cincisprezece } port = atoi(argv[ ]); listenfd = Open listenfd (port); în timp ce ( ) { connfdp = Mailoc(sizeof(int)); * connfd = Accept (ascultă, (SA *) &clientaddr, &clientlen); Pthread create(&tid, NULL, thread, &connfd); } } /* rutină fir */ void *thread (void *vargp) { int connfd = *((int *) vargp); Pthread detach(pthread self()); Liber (vargp); echo(connfd); Close(connfd); returnează NULL; } Abordarea evidentă este să treceți un pointer către un mâner ca acesta: connfd = Accept (ascultă, (SA *) &clientaddr, &clientlen); pthread create(&tid, NULL, thread, &connfd); Firul peer dereferențează apoi pointerul și îl atribuie unei variabile locale astfel: void *thread (void *vargp) { int connfd = *( (int *)vargp); } Capitolul Programarea în paralel Cu toate acestea, acest lucru ar fi greșit, deoarece reprezintă o concurență între o declarație de atribuire în firul de execuție egal și o instrucțiune de acceptare în firul principal Dacă instrucțiunea de atribuire se finalizează înainte de următoarea instrucțiune accept, atunci variabila locală connfd din fluxul peer este setată la valoarea corectă a descriptorului Totuși, dacă atribuirea se termină după accept, atunci variabila locală connfd din firul de execuție peer este setată la următorul număr de descriptor de conexiune Rezultatul inutil aici este că cele două fire fac acum intrare și ieșire pe același mâner Pentru a evita o cursă potențială către partea de jos, fiecare handle asociat returnat de accept trebuie să fie atribuit propriului bloc de memorie alocat dinamic, așa cum se arată în rândurile - Autorii intenţionează să revină asupra problemei curselor în Sec O altă problemă este evitarea scurgerilor de memorie într-o rutină de fire Deoarece firele de execuție nu sunt colectate în mod explicit, fiecare fir de execuție trebuie separat, astfel încât resursele sale de memorie să fie recuperate când firul de execuție se termină (linia ) Mai mult, este necesar să se monitorizeze eliberarea blocului de memorie alocat de firul principal (linia ) EXERCIȚIUL În serverul bazat pe procese (Listarea ), mânerul asociat a fost furnizat în procesele părinte și copil Cu toate acestea, într-un server bazat pe fire de execuție (Listarea - ), mânerul asociat este închis numai în firul de execuție peer De ce? Variabile partajate în programele cu thread-uri Din punctul de vedere al unui programator, unul dintre aspectele atractive ale utilizării thread-urilor este ușurința cu care mai multe fire pot partaja aceleași variabile de program Cu toate acestea, acest tip de partajare poate fi dificil Pentru a scrie corect programe cu thread-uri, trebuie să înțelegeți clar ce înseamnă partajare și cum funcționează Înțelegerea dacă o variabilă este partajată într-un program necesită luarea în considerare a câteva întrebări fundamentale: care este modelul de memorie de bază pentru fire, care sunt instanțe ale unei variabile mapate în memorie și câte fire accesează fiecare dintre acele instanțe O variabilă este partajată (partajată) numai dacă firele accesează o anumită instanță a acelei variabile Pentru a consolida discuția despre ideea de partajare, autorii folosesc programul prezentat în Lista ca exemplu de lucru Pare puțin confuz, dar este util de studiat deoarece ilustrează câteva puncte „subtile” ale conceptului de împărtășire Partea a III-a Interacțiuni și relații cu programul centura Exemplul de program constă dintr-un fir principal care creează două fire de execuție Firul principal transmite fiecărui thread peer un identificator unic care este folosit pentru a tipări mesajul personal, împreună cu un număr total de apeluri ale rutinei firului de execuție flinclude „csapp h” #definiți N void *thread (void *vargp); caractere **ptr; /* variabilă globală */ int main() opt { int i; pthread t tid; caractere *msgs[N] = { „Bună ziua de la foo”, „Bună ziua de la bar” paisprezece }; cincisprezece ptr = mesaje; pentru (i = ; i /badcnt BOOM! ctr= unix> /badcnt BOOM! ctr= unix> /badcnt BOOM! ctr= Ce s-a întâmplat? Pentru o înțelegere clară a problemei, este necesar să se studieze autocodul de compunere pentru contorul de bucle (Fig ) Va fi util să spargeți codul buclei pentru firul i în cinci părți Partea a III-a, Interacțiuni și relații cu programe Hj - bloc de comenzi la începutul ciclului L, este o instrucțiune care încarcă variabila partajată cnt în registrul %eaxi, unde %eaxi este valoarea registrului %eax din fluxul i Ut este o comandă care actualizează % fiecare S/ este o comandă care stochează valoarea actualizată a lui %eaxi în variabila partajată cnt T, - bloc de comandă la sfârșitul ciclului Asamblator pentru filet I Cod C pentru flux / pentru (i- ; KNITERS; І++) ctr++; L : movl - (%ebp), %eax cmpl USD, %xax jle L £}R : N ° L : movl ctr,%eax leal l(%eax),%edx Y S int sem init (sem t *sem, , valoare int fără semn); int sem wait (sem t *s); /* P(e) */ int sem post(sem t*s); /* V(e) */ Programul inițializează semaforul apelând funcția sem init Funcția sem init inițializează semaforul sem la valoare Fiecare semafor trebuie inițializat înainte de utilizare Pentru scopurile descrise aici, argumentul mediu este întotdeauna Programele efectuează operațiile P și V apelând funcțiile sem wait și, respectiv, sem post Pentru concizie, autorii preferă să folosească următoarele funcții de interfață P și V\ #include „csapp h” void P(sem t*s); /* Funcția de interfață pentru sem wait */ void V(sem t*s); /* Funcția de interfață pentru sem post */ De exemplu, pentru a sincroniza corect contorul de exemplu dat, puteți declara un semafor numit mutex: sem t mutex; Apoi este inițializat la unul din rutina principală: Sem init(&mutex, , I); În cele din urmă, variabila cnt este protejată de mediu cu operațiile P și V în mutex: P(&mutex); cnt++; V(&mutex); Partea a III-a Interacțiuni și relații cu programul Folosind semafoare pentru programarea resurselor partajate Secțiunea anterioară a discutat despre utilizarea semaforelor pentru a oferi acces reciproc exclusiv la variabilele partajate O altă utilizare importantă a semaforelor este programarea acceselor la resursele partajate În acest scenariu, un fir de execuție utilizează o operație cu semafor pentru a notifica un alt fir de execuție că o anumită condiție din starea programului a devenit adevărată Un exemplu clasic: modelul producător-consumator din Fig Firul producător și firul consumator împărtășesc un buffer limitat cu și segmentele Buffer partajat Orez Model producator-consumator Firul de producție creează în mod repetat elemente noi și le introduce în buffer Thread-ul de consum elimină în mod repetat elemente din buffer și le folosește Sunt posibile și variante cu un număr diferit de producători și consumatori Deoarece inserarea și ștergerea elementelor implică actualizarea variabilelor partajate, trebuie să vă asigurați accesul care se exclude reciproc la buffer Cu toate acestea, excluderea reciprocă garantată nu este suficientă De asemenea, aici trebuie să programați accesările la buffer Dacă tamponul este plin (nu există segmente goale), atunci producătorul trebuie să aștepte ca segmentul să devină liber În mod similar, dacă tamponul este gol (nu există elemente disponibile), atunci consumatorul trebuie să aștepte să apară elementele Interacțiunea producător-consumator este o întâmplare comună în sistemele reale De exemplu, într-un sistem multimedia, sarcina producătorului este să codifice cadre video, iar consumatorul este să le decodeze și să le afișeze pe ecran Scopul buffer-ului este de a reduce fluctuația în fluxul de date video cauzate de diferențele de dependențe de date în timpii de codificare și decodare a cadrelor individuale Buffer-ul oferă producătorului un depozit de segmente și consumatorului un depozit de cadre codificate Un alt exemplu comun este dezvoltarea de interfețe grafice cu utilizatorul Producătorul detectează semnalele mouse-ului și tastaturii (evenimente) și le introduce în buffer Consumatorul elimină aceste evenimente din buffer într-o anumită ordine de prioritate și colorează imaginea de pe ecran În această secțiune, vom dezvolta un pachet simplu numit SBUF pentru proiectarea programelor producător-consum Următoarea secțiune va analiza modalități de utilizare pentru a construi un server paralel interesant bazat pe pre-threading SBUF funcționează cu tampoane de tip sbuf t (Listarea - ) Articolele sunt stocate în Capitolul Programarea în paralel matrice întregi alocate dinamic buf de și elemente Indicii front și geag țin evidența primului și ultimului element din matrice Trei semafoare controlează momentul accesului la buffer Un semafor mutex oferă acces reciproc exclusiv la un buffer Semaforele și elementele numără numărul de segmente goale și, respectiv, elementele disponibile typedef struct { int *buf;/* Buffer array */ int n;/* Numărul maxim de segmente */ int front;/* buf [ (front+ ) %n] - primul element */ int rear;/* buf [rear%n] - ultimul element */ sem t mutex;/* Protejați accesul la buf */ sem t siots;/* Numărați segmentele disponibile */ sem t articole;/* Numărează articolele disponibile */ } sbuf t; Funcția sbuf init (Listarea - ) alocă memorie rezervată pentru buffer, setează front și geag pentru a indica un buffer gol și atribuie valori primare la trei semafore Această funcție este apelată o dată înainte ca oricare dintre celelalte trei funcții să fie apelată void sbuf init (sbuf t *sp, int n) { sp->= Calloc(n, sizeof(int)); sp->n = n;/* Bufferul conține numărul maxim de n elemente */ sp->fata = sp-> spate = ; /* Golire tampon dacă față = = spate */ Sem init (&sp-> mutex, , );/* Semafor binar de blocat */ Sem init(&sp->siots, , n); /* În primul rând buf are n segmente goale */ Sem init (&sp-> itemi, , );/* prim buf are elemente de date */ nouă} Funcția sbuf deinit (nespecificată) eliberează tamponul de stocare atunci când aplicația software îl folosește Funcția sbuf insert (Listul - ) așteaptă un segment disponibil, blochează mutex-ul, adaugă un element, deblochează mutex-ul și apoi declară noul element void sbuf insert (sbuf t *sp, articol int) { P (&sp->slot);/* Așteptați segmentul disponibil */ Partea a III-a Interacțiuni și relații cu programul P (&sp->mutex); /* Blocare tampon */ sp->buf [++sp->spate) % (sp->n)] = item; /* Inserează elementul */ V (&sp->mutex);/* Deblocare tampon */ V (&sp->articole);/* Declararea unui articol disponibil */ opt } Funcția sbuf remove (lista - ) este simetrică După așteptarea unui element tampon disponibil, blochează mutexul, îndepărtează elementul din partea din față a tamponului, deblochează mutexul și apoi semnalează prezența unui nou segment I Lista , Element eliminat din bufferul partajat " A " * ""& L ' p ' slot);/* Așteptați segmentul disponibil */ P (&sp->mutex);/* Blocare tampon */ item = sp->buf [ (++sp ->front) % (sp->n)]; /* Eliminați elementul */ V (&sp->mutex);/* Deblocare tampon */ V (&sp->slot);/* Declararea unui element accesibil */ articol returnat; YU} Alte mecanisme de sincronizare Autorii au demonstrat deja sincronizarea firelor folosind semafore, în principal pentru că sunt simple, clasice și au un model semantic clar Cu toate acestea, merită să știți că există și alte tehnici de sincronizare De exemplu, firele de execuție în Java sunt sincronizate printr-un mecanism numit monitorul Java [ ], care oferă un nivel mai ridicat de abstractizare a excluderii reciproce și capabilități de programare a semaforului; de fapt, monitoarele pot fi implementate cu semafore Un alt exemplu este interfața pre-threading Pthread, care definește un set de operații de sincronizare pe variabile mutex și condiție Pthreads mutexurile sunt folosite pentru excluderea reciprocă Variabilele de condiție sunt utilizate pentru a programa accesul la resursele partajate, cum ar fi un buffer limitat într-un program producător-consum Server paralel bazat pe pre-threading Acest capitol a acoperit utilizarea semaforelor pentru accesarea variabilelor partajate și pentru programarea acceselor la resursele partajate Pentru o mai bună înțelegere a acestor probleme, le aplicăm pe un server paralel folosind metoda pre-threading (pthreading) Capitolul Programarea în paralel În serverul paralel (vezi Lista - ), este creat un fir nou pentru fiecare client nou Dezavantajul acestei abordări este supraîncărcarea semnificativă asociată cu crearea unui fir nou pentru fiecare client nou Serverul de pre-threading reduce aceste costuri generale folosind modelul producător-consumator prezentat în Figura Orez Organizarea unui server paralel bazat pe organizarea prealabilă a procesării firelor Serverul este format dintr-un fir principal și multe fire de lucru Firul principal acceptă în mod repetat solicitările de conexiune de la clienți și plasează mânerele de conexiune rezultate într-un buffer partajat Fiecare thread de lucru îndepărtează în mod repetat mânerul din buffer, servește clientul și apoi așteaptă următorul mâner Lista - arată cum să utilizați pachetul SBUF pentru a implementa un server echo paralel bazat pe pre-threading După ce sbuf este inițializat (linia ), firul principal creează un set de fire de lucru (liniile - ) Firul principal intră apoi în bucla infinită a serverului, acceptând cererile de conectare și inserând mânerele de legătură rezultate în sbuf Fiecare fir de lucru are un comportament foarte simplu Așteaptă ca mânerul asociat să fie eliminat din buffer (linia ), apoi apelează funcția echo cnt pentru a reflecta intrarea clientului | Lista Server de ecou paralel bazat pe pre-organizare | procesare in-line #include „csapp h” #include „sbuf h” tfdefine NTHREADS tfdefine SBUFSIZE cinci void echo cnt(int connfd); void *thread(void *vargp); opt Partea a III-a Interacțiuni și relații cu programul sbuf t sbuf; /* Buffer de manevrare a linkului partajat */ int main(int argc, char **argv) { int i, listenfd, connfd, port, clientlenesizeof(struct sockaddr in); struct sockaddr in clientaddr; pthread t tid; if (argc ! ) { fprintf(stderr, „utilizare: %s \n”, argv(OJ); ieșire( ); douăzeci } port - atoi(argv[l]); sbuf init(&sbuf, SBUFSIZE); listenfd ■ Open listenfd(port); pentru (i i ; i Buna ziua Buna ziua Buna ziua Buna ziua /cursa din din din din fir de fir fir fir unu | Lista program de curse tfinclude „csapp h” #definiți N void *thread(void *vargp); cinci int main() { pthread t tid[N]; int i; pentru (i = ; i /stinge salut din threadul salutare din firul salut din threadul salutare din firul HPHAG EH ȘI E În Lista - , ar putea fi tentant să eliberați blocul de memorie alocat imediat după linia de pe firul principal, în loc să-l eliberați pe firul de execuție Dar nu va fi corect De ce? EXERCIȚIUL t - Cursa a fost eliminată prin alocarea unui bloc separat de memorie pentru fiecare identificator întreg Sugerați o altă modalitate care nu necesită apelarea mailoc sau gratuit Care sunt avantajele și dezavantajele acestei abordări? Deadlock (deadlocks) Semaforele oferă potențialul pentru una dintre erorile de rulare numite blocaje, în care un set de fire se blochează în timp ce așteaptă o condiție care nu va fi niciodată adevărată Pentru a înțelege natura blocajelor, cel mai valoros instrument este graficul de progres De exemplu, în fig Figura - prezintă un grafic de progres pentru o pereche de fire folosind două semafore pentru excluderea reciprocă Din acest grafic, putem trage câteva concluzii importante legate de înțelegerea fenomenului de blocare reciprocă a firelor: Partea a III-a Interacțiuni și relații cu programul □ Programatorul a ordonat greșit operațiile P și V astfel încât zonele interzise ale celor doi semafori să se suprapună Dacă se întâmplă ca orice cale de execuție să atingă starea de blocaj J, atunci nu mai este posibil niciun progres deoarece zonele interzise suprapuse blochează progresul în fiecare direcție permisă Cu alte cuvinte, programul este blocat deoarece fiecare fir așteaptă ca celălalt să efectueze o operație AND, ceea ce nu se întâmplă niciodată □ Suprapunerea zonelor interzise provoacă un set de stări numită zonă de blocaj (sau zonă de blocaj) Dacă traiectoria intră brusc în contact cu o stare din zona de impas, atunci aceasta din urmă este inevitabil Traiectorii pot intra în zone de blocaj, dar nu le părăsesc niciodată □ Blocajul este o problemă deosebit de complicată, deoarece nu poate fi întotdeauna prevăzută Unele căi de execuție „reușite” vor ocoli zona de blocaj; alții nu vor fi atât de norocoși Pe fig este un exemplu al ambelor situații Consecințele pentru programator pot fi, ca să spunem ușor, nu foarte plăcute Programul poate fi rulat de de ori fără probleme, iar în data de va fi un blocaj Oricare program va funcționa bine pe o mașină, dar va „eșua” pe alta Cel mai rău dintre toate, acesta nu poate fi repetat, pentru că diferite execuții au traiectorii diferite Fluxul P(s) P(t) V(s) V(t) Orez Graficul de progresie pentru un program care poate intra într-un impas Fluxul Capitolul Programarea în paralel Programele intră în blocaje din multe motive, iar evitarea lor este o sarcină dificilă Cu toate acestea, atunci când se utilizează semafore binare, așa cum se arată în Fig , se poate aplica următoarea regulă simplă și eficientă pentru a evita blocajele: Un program este liber de blocaj dacă, pentru fiecare pereche de mutexuri ( , /) din program, fiecare fir care deține și t le blochează simultan în aceeași ordine De exemplu, puteți remedia blocajul prezentat în Fig , mai întâi blocând și apoi t în fiecare fir Pe fig arată graficul de progres rezultat Fluxul V(e) Zona interzisa pentru s Zona interzisa pentru t P(e) s inițial = t= P(s) P(t) V(s) • • • V(t) Orez Graficul de progres pentru un program fără blocaje HR RAZH” ȘI E Luați în considerare următorul program, care încearcă să folosească o pereche de semafoare pentru excluderea reciprocă: Inițial: s = , t = Subiect l:Fii : P(s) ;P(s) ; V(s);V(s); P(t);P(t); V(t);V(t); Partea a III-a Interacțiuni și relații cu programul Desenați un grafic de progres pentru acest program Va fi întotdeauna o fundătură? Dacă da, ce simplă modificare a valorilor inițiale ale semaforului ar elimina riscul potențial al unui blocaj? Desenați un grafic de progres pentru programul fără blocaj rezultat rezumat Un program paralel constă dintr-un set de circuite logice care se suprapun în timp Acest capitol a explorat trei mecanisme diferite pentru construirea de programe paralele: procese, multiplexare I/O și fire de execuție Pe tot parcursul discuției, serverul de rețea paralelă a fost folosit ca aplicație motivațională Procesele sunt programate automat de nucleu și, deoarece au spații de adrese virtuale separate, necesită mecanisme explicite IPC (Comunicare interprocesor) pentru a partaja datele Programele bazate pe evenimente își creează propriile circuite logice paralele, modelate ca mașini de stare și folosesc multiplexarea I/O pentru a programa în mod explicit firele de execuție Deoarece programele rulează în același proces, partajarea datelor între scheme este rapidă și ușoară Fluxurile sunt o simbioză (hibrid) a acestor abordări Așa cum logica se bazează pe procese, firele sunt programate automat de nucleu Așa cum logica se bazează pe multiplexarea I/O, firele de execuție rulează în contextul unui singur proces și pot partaja rapid și ușor datele Indiferent de mecanismul de concurență, sincronizarea acceselor simultane la datele partajate este o problemă complexă Pentru a ajuta, au fost dezvoltate operațiile P și V pe semafoare Operațiunile cu semafor pot fi folosite pentru a oferi acces mutual exclusiv la datele partajate și pentru a programa accesul la resurse, cum ar fi tampoanele partajate în programele producător-consum Serverul de ecou paralel pre-threaded oferă un exemplu convingător al acestor două cazuri de utilizare a semaforului Paralelismul este și o sursă a altor dificultăți Funcțiile apelate de fire trebuie să aibă o proprietate numită thread safety Capitolul evidențiază patru clase de funcții nesigure pentru fire, împreună cu sugestii pentru a le face sigure Funcțiile de reintrare sunt un subset necesar de funcții thread-safe care nu au acces la date partajate Funcțiile de reintrare sunt adesea mai eficiente decât cele care nu sunt reintrate, deoarece nu necesită Capitolul Programarea în paralel sincronizare Cursele și blocajele sunt alte probleme complexe care apar la construirea programelor paralele Cursele apar atunci când programatorii fac presupuneri incorecte despre modul în care sunt planificate circuitele logice Blocajele apar atunci când un fir de lucru așteaptă un eveniment care nu se va întâmpla niciodată Note bibliografice Operațiile cu semafor sunt propuse de Dijkstra [ ] Conceptul de grafice de progres a fost introdus de Coffrnan [ ] și ulterior formalizat de Carson și Reynolds [ ] Cartea lui Butenhof [ ] este o descriere detaliată a interfeței sistemului de operare portabil (POSIX) Materialul lui Birrell (Birrell) [ ] este o excelentă introducere în flux Pugh recunoaște punctele slabe ale modului în care firele Java comunică prin memorie și propune modele de înlocuire a memoriei [ ] Sarcini pentru soluție acasă exercițiu ♦ Scrieți o versiune a programului hello c care creează și culege n fluxuri peer îmbinate, unde n este un argument de linie de comandă exercițiul E:nі și E Programul din lista următoare are o eroare Firul ar trebui să se oprească (somn) pentru o secundă și apoi să imprime șirul Cu toate acestea, atunci când este rulat pe sistemul nostru, nimic nu este tipărit De ce? #include „csapp h” void *thread(void *vargp); int main() cinci { • pthread t tid; Pthread create(&tid, NULL, thread, NULL); ieșire( ); } unsprezece /* rutină fir */ void *thread(void *vargp) paisprezece { Somn( ); printf("Bună ziua, lume!\n"); returnează NULL; optsprezece } Partea a III-a Interacțiuni și relații cu programul Această eroare poate fi corectată prin înlocuirea funcției de ieșire pe linia cu un apel la una sau două funcții Pthreads diferite Ce? EXERCIȚIUL ♦♦ Testați înțelegerea funcției de selectare modificând programul server (Listarea - ) pentru a reflecta maximum o linie de text per iterație a buclei serverului principal REGULAMENTUL ♦♦ Serverul de ecou paralel bazat pe evenimente (Listarea - ) are dezavantaje deoarece un client rău intenționat poate refuza serviciul altor clienți prin trimiterea unui șir de text parțial Scrieți o versiune îmbunătățită a programului server care poate procesa aceste șiruri de text parțiale fără a fi blocate EXERCIȚIUL ♦ Funcțiile din pachetul RIO I/O (vezi Secțiunea ) sunt sigure pentru fire Sunt și ei reintrați? UPT-IMPORTANT ♦ Într-un server echo paralel pre-threaded, fiecare fir apelează funcția echo cnt Funcția echo cnt este sigură pentru fire? Este reintrator? De ce da sau de ce nu? EXERCIȚIUL ♦♦ Unele scriere în rețea sugerează următoarea abordare a socket-urilor de citire și scriere: înainte de a interacționa cu clientul, deschideți două fluxuri de intrare/ieșire standard pe același soclu de legare a descriptorului deschis: un flux pentru citire și unul pentru scriere: FIȘIER *fpin, *fpout; fpin = fdopen(sockfd, "r"); fpout = fdopen(sockfd, "w"); Când serverul a terminat de interacționat cu clientul, închideți ambele fire după cum urmează: fclose(fpin); fclose(fpout); Cu toate acestea, dacă încercați această abordare pe un server paralel bazat pe fire, veți crea o condiție de „cursă până la capăt” Explică de ce Capitolul Programarea în paralel EXERCIȚII ♦ Repoziționarea celor două K operațiuni prezentate în Figura va cauza blocaje în program sau nu? Justificați-vă răspunsul desenând un grafic de progres pentru patru cazuri posibile: Cazul Cazul Cazul Cazul Flux Flux Flux Flux Flux Flux Flux Flux P(e) P(e) P(e) P(e) P(e) P(e) P(e) P(e) P(t) P(t) P(t) P(t) P(t) P(t) P(t) P(t) V(s) V(s) V(s) V(t) V(t) V(s) V(t) V(t) V(t) V(t) V(t) V(s) V(s) V(t) V(s) V(s) EXERCIȚIUL ♦ Poate următorul program să intre într-un impas? De ce da sau de ce nu? Inițial: a = , b = , c = Subiectul :Fiul : P(a); P(s); P(b) P(b); V(b); V(b); P(s);V(s); V(e); V(a); CAPITOLUL ♦ Luați în considerare următorul program, care atinge un impas Inițial: a = , b = , c = Thread :thread :thread : P(a); P(c); P(c); P(b); P(b); V(c); V(b); V(b); P(b); P(c); V(c); P(a); V(c); P(a); V(a); V(a); V(a); V(b); Enumeraţi pentru fiecare fir perechile de mutexuri pe care le întreţine în acelaşi timp Partea a III-a Interacțiuni și relații cu programul Dacă a + face ca funcția de selectare să revină cu mânerul în setul de citire EXERCIȚII DE SOLUȚIE Variabila pool ready set este reinițializată înainte de fiecare apel pentru selectare, deoarece servește ca argument de intrare și de ieșire La intrare, conține un set de citire; la ieșire, conține un set gata făcut EXERCIȚII DE SOLUȚIE Deoarece firele de execuție rulează în același proces, toate au același tabel de descriptori Indiferent de câte fire de execuție folosesc mânerul legat, numărul de legături pentru tabelul de fișiere al mânerului legat este unul Astfel, o singură operațiune de închidere este suficientă pentru a elibera resursele de memorie asociate cu mânerul asociat atunci când utilizatorul a terminat cu acesta EXERCIȚII DE SOLUȚIE Ideea de bază aici este că variabilele stivei sunt private, în timp ce variabilele globale și statice sunt partajate Variabilele statice precum cnt sunt complicate, deoarece partajarea este limitată la funcțiile din limitele lor, în acest caz rutina firului Iată un tabel și o descriere a variabilelor: • ptr este o variabilă globală scrisă de firul principal și citită de firele de execuție; • cnt este o variabilă statică cu o instanţă în memorie care este citită şi scrisă de două fire de execuţie; Capitolul Programarea în paralel • i sh este o variabilă automată locală stocată în stiva firului principal Chiar dacă valoarea sa este transmisă firelor de execuție peer, acestea nu o accesează niciodată pe stivă și, prin urmare, nu este partajată; • msgs m este o variabilă automată locală stocată pe stiva firului principal, accesată indirect prin intermediul ptr de către ambele fire de execuție; • myid O și myid l sunt instanțe ale unei variabile automate locale situate pe stivele de fire egale și, respectiv, Variabila de instanță Inversarea firului principal? Se inversează fluxul peer ? Se inversează fluxul peer ? Ptr Da Da Da cnt Nu Da Da i m Da Nu Nu msgs m Da Da Da myid pO Nu Da Nu myid pl Nu Nu Da Variabilele ptr, cnt și msgs sunt accesate de mai multe fire, prin urmare sunt partajate EXERCIȚII DE SOLUȚIE Ideea importantă este că nu se pot face presupuneri cu privire la ordinea pe care o alege nucleul atunci când programează firele Comanda Flux de Pasi %eaxi %eax ctr I, - - - n - - Lz - U - s - - Si - Partea a III-a Interacțiuni și relații cu programul (final) Comanda fluxului de pas %xaxi %ex ctr L - Т - Variabila cnt are o valoare finală invalidă de SOLUȚIE ȘI EXERCIȚIU Funcția gethostbyname nu este reintrentă deoarece fiecare apel partajează aceeași variabilă statică returnată de funcția gethostbyname Cu toate acestea, este sigur pentru fire deoarece accesul la variabila partajată este protejat de operațiunile P și AND, astfel încât acestea se exclud reciproc EXERCIȚII DE SOLUȚIE Dacă blocul este eliberat imediat după apelul la pthread create pe linia , atunci va fi introdusă o nouă cursă, de data aceasta între apelul la free pe firul principal și declarația de atribuire pe linia a rutinei thread-uri REzolvarea exercițiului O altă abordare este să transmiteți un întreg i direct în loc să treceți un pointer către i: pentru (i = ; i int-expr int-expri >= int-expr Test de egalitate Test neegal Test insuficient Test insuficient sau egal Test suficient Suficient sau verificare egală ! bool-expr NU bool-expr \ && bool-expr AND bool-expr| | | bool-expr SAU Există doar trei tipuri de expresii întregi: numere, semnale întregi denumite și expresii de selecție Numerele sunt scrise cu zecimale și pot fi negative Semnalele întregi denumite folosesc regulile de denumire descrise mai devreme Expresiile de selecție au următoarea formă generală: [ bool-expr \ bool-expr bool-exprk int-expr int-expr int-exprk Această expresie conține o serie de blocuri, în care fiecare bloc i constă dintr-o expresie bool-exprh care indică dacă acest bloc trebuie selectat și o expresie întreagă int-expr^ care indică valoarea acestui bloc Când se evaluează selecția expresiilor, expresiile booleene sunt comparate conceptual în secvență Când unul dintre ele evaluează la , valoarea expresiei întregi corespunzătoare este returnată ca valoare a expresiei selectate Dacă niciunul Anexa expresia booleană nu are valoarea , atunci valoarea expresiei select este Unul dintre principiile bune de programare este valoarea a ultimei expresii booleene, care va garanta cel puțin un bloc de potrivire Expresiile HCL sunt folosite pentru a defini comportamentul unui bloc de logica de control O definiție de bloc are una dintre următoarele forme: cale bool = bool-expr cale int = int-expr\ unde prima formă definește un bloc boolean și a doua definește un bloc la nivel de cuvânt Pentru un bloc declarat cu calea numelui HCL C generează funcția gen name Această funcție nu ia argumente și returnează un rezultat int Exemplu HCL Următorul exemplu arată un fișier HCL complet Poate fi compilat și executat folosind argumente de linie de comandă pentru semnalele de intrare Mai tipic, fișierele HCL definesc doar partea de control a modelului de simulare Codul C generat este apoi compilat și legat cu alt cod pentru a forma un program Acest exemplu este oferit doar ca o demonstrație vizuală a HCL Ciclul se bazează pe ciclul mix descris în sec cu următoarea structură (Fig A ), reprezentată de Listarea A Orez P Structura programului exemplu ## Un exemplu simplu de fișier HCL ## Poate fi convertit în C folosind hcl c și apoi compila ## Acest exemplu va genera bucla MUX prezentată în ## secțiunea \obey{ } Este format dintr-o unitate de control, ## generând semnale la nivel de bit sl și s din codul semnalului ## intrări, apoi utilizează aceste semnale pentru a controla cele căi ## multiplexor cu date de intrare A, B, C și D nouă Descrierea logicii de control a procesoarelor care folosesc HCL unsprezece paisprezece cincisprezece optsprezece nouăsprezece douăzeci treizeci cincizeci ## Acest cod este încorporat într-un program C care citește ## valorile codului h, B, C și D din linia de comandă, ## și tipăriți rezultatul buclei ## Informații introduse text în fișierul C citat „#include ” citat „#include ” citat 'int code val, s val, sl yal;' citați 'char **nume date; ' ## Declarații de semnal utilizate în declarația HCL și ## expresiile C corespunzătoare boolsig s 's val' boolsig sl 'sl val' cod insig 'code val' intig A 'atoi(data names[ ])' intig În „atoi(data names[ ])” intig C 'atoi(data names[ ])' intig D 'atoi(data names[ ])' ## Descrieri HCL ale blocurilor logice bool sl = cod în { , }; bool sO = cod în ( , }; int Out = [ !sl && !s : : A; # !sl : B; # sl && !s : C; # : D; # unsprezece ]; ## Mai multe informații sunt introduse literal în codul C pentru a ## calcula valori și tipări datele de ieșire citatul „int main(int argc, char *argv[]) {' quote 'data names = argv+ ;' citat 'code yal' atoi(argv[ ]);' cita 'sl val ■ gen sl();' citat 's val = gen s ();' citat ' printf("Out ■ %d\n", gen Out ());' citați „întoarce ;” citat „}” Aceasta specifică faptul că semnalele booleene s și sl și codul semnalului întreg vor fi imaginile referințelor la variabilele globale s val, sl val și code val Anexa Semnalele întregi a, b, c și d sunt declarate, unde expresiile C corespunzătoare aplică funcția standard de bibliotecă atoi șirurilor de caractere transmise ca argumente de linie de comandă Definiția unui bloc numit sl generează următorul cod C: intgen sl() { return ((code val) == | | (code val) == ); } Aici puteți vedea că testul de apartenență este implementat ca o serie de comparații, iar fiecare apel la semnalul de cod este înlocuit cu expresia code val Rețineți că nu există o relație directă între semnalul sl declarat pe linia a fișierului HCL și blocul numit sl declarat pe linia Unul este imaginea unei expresii C, în timp ce celălalt generează o funcție numită gensl Textul citat de la sfârșit generează următoarea funcție principală: int principal (int argc, char *argv[ ]) { nume date = argv+ ; code val = atoi(argv[ ]); sl val = gen sl(); sO val = gen sO(); printf "Out = %d\n", gen ut ()); întoarce ; } Funcția principală apelează funcțiile gen si și gen Out generate din definițiile blocurilor De asemenea, se vede cum codul C trebuie să determine succesiunea evaluărilor blocurilor și setarea valorilor utilizate în expresiile C reprezentând diferite valori ale semnalului Descriere SECV unu ################################################# #################### # HCL-descriere a controlului procesorului Y cu un ciclu SEQ # # Copyright (C) Randal E Bryant, David R O'Hallaron, # ################################################ #################### cinci ################################################ #################### # C Include Nu se schimba # opt ################################################################## #################### nouă citat „#include ” citat „#include „isa h”” Descrierea logicii de control a procesoarelor care folosesc HCL citat „#include ”sim h”’ citat ' int simjnain (int argc, char *argv(]);' citat „int gen pc() {return ;}” citat „int main(int argc, char *argv[])” citat '{plusmode= ;return simjnain(argc,argv);}' optsprezece ################################################# #################### # Anunțuri Nu modifica/muta/sterge # douăzeci ################################################ #################### ##### Reprezentarea simbolică a codurilor de comandă Y ############## intig INOP „I NOP” intig IHALT „I HALT” intig IRRMOVL 'I RRMOVL' intig IIRMOVL „I IRMOVL” intig IRMMOVL „I RMMOVL” intig IMRMOVL 'IJ RMOVL' intig IOPL 'I ALU' intig IJXX 'I-JMP' intig ICALL „I CALL” intig IRET 'I RET' intig IPUSHL 'I PUSHL' intig IPOPL 'I POPL' ##### Reprezentarea simbolică a registrelor Y , pe care link-uri explicite ##### intig RESP 'REG ESP' # Indicator de stivă intig RNONE ' REG NONE' # Valoare specială, indicând nici un registru ##### Funcții ALU menționate în mod explicit ##### intsig ALUADD 'A ADD' # ALU trebuie să-și adauge argumentele ##### Semnale care pot fi accesate prin logica de control ######### ##### Date de intrare ale etapei de eșantionare ##### intig pc 'pc' # Număr de programe ##### Preluare calcule pași ##### intsig icode 'icode' # Cod de control al comenzii intsig ifun 'ifun' # Funcția de comandă intig rA 'ga' # Câmp rA de la comandă intig rB 'rb' # GB câmp de la comandă intig valC 'vale' # Constanta de la comanda intig valP 'valp' # Adresa următoarei comenzi Anexa ##### Calcule pentru etapele de decodare ##### intig valA 'vala' # Valoarea de la portul A de registru intig valB 'valb' # Valoare din registrul portului B #####■ Calcule de rulare ##### intig valE 'vale' # ALU valoare calculată boolsig Bch 'bcond' # Testarea ramurilor ##### Calcule pasi de memorie ##### intig valM 'valm' # Valoare citită din memorie #################################################################### # ################## # Definițiile semnalului de control # #################################################################### # ################## ################ Etapa de eșantionare ############################## # ## # Comanda selectată necesită octeți regid? bool need regids = icode în { IRRMOVL, IOPL, IPUSHL, IPOPL, IIRMOVL, IRMMOVL, IMRMOVL}; # Comanda selectată necesită un cuvânt constant? bool need valC = icode în { IIRMOVL, IRMMOVL, IMRMOVL, IJXX, ICALL }; bool instr yalid = icode in { INOP, IHALT, IRRMOVL, IIRMOVL, IRMMOVL, IMRMOVL, IOPL, IJXX, ICALL, IRET, IPUSHL, IPOPL }; ################ Etapa de decodare ## Ce registru ar trebui folosit ca sursă A? int srcA "[ icode în { IRRMOVL, IRMMOVL, IOPL, IPUSHL } : rA; icode în { IPOPL, IRET } : RESP; : RNONE; # Înregistrarea nu este necesară ]; ## Ce registru ar trebui folosit ca sursă B? int srcB = [ icode în { IOPL, IRMMOVL, IMRMOVL } : rB; icode în { IPUSHL, IPOPL, ICALL, IRET } : RESP; : RNONE; # Înregistrarea nu este necesară ]; Descrierea logicii de control a procesoarelor care folosesc HCL ## Ce registru ar trebui folosit ca destinație E? int dstE = [ icode în { IRRMOVL, IIRMOVL, IOPL} : rB; icode în { IPUSHL, IPOPL, ICALL, IRET } : RESP; : RNONE; # Înregistrarea nu este necesară ]; ## Ce registru ar trebui folosit ca destinație M? int dstM = [ icode în { IMRMOVL, IPOPL } : rA; : RNONE; # Înregistrarea nu este necesară ]; ################ Runtime ################################ ## ## Selectați datele de intrare A pe ALU int aluA = [ icode în { IRRMOVL, IOPL } : valA; icode în { IIRMOVL, IRMMOVL, IMRMOVL } : valC; icode în { ICALL, IPUSHL } : - ; icode în { IRET, IPOPL } : ; # Alte instrucțiuni nu necesită ALU ## Selectați datele de intrare B pe ALU int aluB = [ icode în { IRMMOVL, IMRMOVL, IOPL, ICALL, IPUSHL, IRET, IPOPL } : valB; icode în { IRRMOVL, IIRMOVL } : ; # Alte instrucțiuni nu necesită ALU ]; ## Setarea funcției ALU int alufun = [ icode = IOPL : ifun; : ALUDD; ]; # Codurile de stare trebuie actualizate? set cc = icode în { IOPL }; ############# Etapa memoriei ################################## Setarea semnalului de control al citirii mem read = icode în { IMRMOVL, IPOPL, IRET }; Anexa Setați semnalul de control al scrierii mem write = icode în { IRMMOVL, IPUSHL, ICALL }; Selectarea adresei de memorie mem addr = [ icode în { IRMMOVL, IPUSHL, ICALL, IMRMOVL } : valE; icode în { IPOPL, IRET } : valA; # Alte comenzi nu necesită adresa ]; ## Selectați datele de intrare din memorie int mem data = [ # Valoare din registrul icode în { IRMMOVL} : va IPUSHL; # Returnează codul PC „ ICALL : valP; # Implicit: Nimic nu este înregistrat ]; ############# Actualizați contorul de programe ########################## ## Care adresă ar trebui să fie comanda selectată int new j?c = [ # Apel Folosind constanta de comandă icode = ICALL : valC; # Ramura selectată Folosind constanta de comandă icode „ IJXX && Bch : valC; # Terminarea comenzii RET Folosind o valoare din stivă icode == IRET : valM; # Implicit: Utilizați contorul de programe incrementat : vaIP; Descriere SEQ+ unu ################################################# #################### # Descrierea controlului HCL a procesorului Y cu un ciclu SEQ + # # Copyright (C) Randal E Bryant, David R O'Hallaron, # ################################################ #################### cinci ################################################ #################### # C Include Nu se schimba # opt ################################################################## #################### nouă Descrierea logicii de control a procesoarelor care folosesc HCL unsprezece paisprezece cincisprezece optsprezece nouăsprezece douăzeci treizeci cincizeci citat „#include ” citat „#include „isa h”” citat „#include „sim h”” cita 'int simjnain(int argc, char *argv[]);' citat „int gen new pc(){return ;}” citat „int main(int argc, char *argv[])” citat „{plusmode=l;return sim main(argc,argv);}” #################################################################### # ################## # Reclame Nu modifica/muta/sterge # #################################################################### # ################## ##### Reprezentarea simbolică a codurilor de comandă Y ############# intig INOP „I-NOP” intig IHALT „I HALT” intig IRRMOVL 'I RRMOVL' intig IIRMOVL „I IRMOVL” intig IRMMOVL „I RMMOVL” intig IMMRMOVL „I MRMOVL” intig IOPL 'I ALU' intig IJXX 'I JMP' intig ICALL „I CALL” intig IRET 'I RET' intig IPUSHL 'I PUSHL' intig IPOPL 'I POPL' ##### Reprezentarea simbolică a registrelor Y la care se face referire explicit ##### intig RESP 'REG ESP' # Indicator de stivă intig RNONE 'REG NONE' # Indică o valoare specială pentru nici un registru ##### Funcții ALU menționate în mod explicit intsig ALUADD ##### „A ADD” # ALU trebuie să-și adauge argumentele ##### Semnale care pot fi accesate prin logica de control ######### ##### Date de intrare pentru etapa contorului programului ## Toate aceste valori se bazează pe valorile din comanda anterioară intig plcode 'prev icode' # Cod de control al comenzii intsig pVAIC 'prev valc' # Constanta de la comanda intsig pValM 'prev valm' # Valoare citită din memorie intsig pValP 'prev valp' # Contor de program incrementat boolsig pBch 'prev bcond' # Flag al ramurii selectate Anexa ##### Preluare calcule pentru pași ##### intig icode 'icode' # Cod de control al comenzii intsig ifun 'ifun' # Funcția de comandă intig rA 'ra' # Câmp rA de la comandă intig rB 'rb' # GB câmp de la comandă intig valC 'vale' # Constanta de la comanda intig valP 'valp' # Adresa următoarei comenzi ##### Decodificarea calculelor pasilor intsig vaIA 'vala' intsig valB 'valb' ##### # Valoarea din portul registrului A # Valoarea din portul registrului B ##### Runtime Calcule intsig valE 'vale' boolsig Bch 'bcond' ##### # Valoare calculată de ALU # Ramura de testare ##### Calcule pasi de memorie ##### intig valM 'valm' # Valoare citită din memorie #################################################################### # ################## # Definițiile semnalului de control # #################################################################### # ################## ################ Calcularea contorului programului ###################### # Calculați locația eșantionului pentru comanda dată, pe baza rezultatelor # din comanda anterioară int pc = [ # apel Folosind o constantă de comandă plcode == ICALL : pValC; # Ramura selectată Folosind constanta de comandă plcode == IJXX && pBch : pValC; # Terminarea comenzii RET Folosind o valoare din stivă plcode == IRET: pValM; # Implicit: Utilizați contorul de programe incrementat : pVAIP; ]; ################ Etapa de eșantionare ############################## # ## # Comanda selectată necesită octeți regid? bool need regids = icode în { IRRMOVL, IOPL, IPUSHL, IPOPL, IIRMOVL, IRMMOVL, IMRMOVL}; Descrierea logicii de control a procesoarelor care folosesc HCL # Comanda selectată necesită un cuvânt constant? boooi need valC = icode în { IIRMOVL, IRMMOVL, IMRMOVL, IJXX, ICALL }; bool instr valid = icode in { INOP, IHALT, IRRMOVL, IIRMOVL, IRMMOVL, IMRMOVL, IOPL, IJXX, ICALL, IRET, IPUSHL, IPOPL }; ############### Etapa de decodare ############################# # # ## Ce registru ar trebui folosit ca sursă A? int srcA e [ icode în { IRRMOVL, IRMMOVL, IOPL, IPUSHL } : rA; icode în { IPOPL, IRET } : RESP; : RNONE; # Înregistrarea nu este necesară ]; ## Ce registru ar trebui folosit ca sursă B? int srcB = [ icode în { IOPL, IRMMOVL, IMRMOVL } : rB; icode în { IPUSHL, IPOPL, ICALL, IRET } : RESP; : RNONE; # Înregistrarea nu este necesară ] ; ## Ce registru ar trebui folosit ca destinație E? int dstE = [ icode în { IRRMOVL, IIRMOVL, IOPL} : rB; icode în { IPUSHL, IPOPL, ICALL, IRET } : RESP; : RNONE; # Înregistrarea nu este necesară ] ; ## Ce registru ar trebui folosit ca destinație M? int dstM = [ icode în { IMRMOVL, IPOPL } : rA; : RNONE; # Înregistrarea nu este necesară ] ; ############### Timp de rulare ############################# ## ## ## Selectarea datelor de intrare ALU A int aluA = [ icode în { IRRMOVL, IOPL } : valA; icode în { IIRMOVL, IRMMOVL, IMRMOVL } : valC; icode în { ICALL, IPUSHL } : - ; icode în { IRET, IPOPL } : / Anexa # Alte instrucțiuni nu necesită ALU ]; ## Selectați datele de intrare B pe ALU int aluB = [ icode în { IRMMOVL, IMRMOVL, IOPL, ICALL, IPUSHL, IRET, IPOPL } : valB; icode în { IRRMOVL, IIRMOVL } : ; # Alte instrucțiuni nu necesită ALU ]; ## Setarea funcției ALU int alufun = [ icode == IOPL : ifun; : ALUDD; ]; ## Ar trebui actualizate codurile de stare? bool set cc = icode în { IOPL }; ################ Etapa memoriei ################################ ### ## Setați semnalul de control al citirii bool mem read = icode în { IMRMOVL, IPOPL, IRET }; ## Setați semnalul de control al înregistrării bool mem write = icode în { IRMMOVL, IPUSHL, ICALL }; ## Selectați adresa de memorie int mem addr = [ icode în { IRMMOVL, IPUSHL, ICALL, IMRMOVL } : valE; icode în { IPOPL, IRET ): valA; # Alte comenzi nu necesită o adresă ]; ## Selectați datele de intrare din memorie int mem data = [ # Valoarea din registru icode în { IRMMOVL, IPUSHL } : vaIA; # Returnați computerul icode - ICALL : valP; # Implicit: Nimic nu este înregistrat ]; Descrierea logicii de control a procesoarelor care folosesc HCL Transportor unu cinci opt nouă unsprezece paisprezece cincisprezece optsprezece nouăsprezece douăzeci ##########################################!###### ################## # HCL-descrierea controlului unui ciclu al procesorului canalizat Y # # Copyright (C) Randal E Bryant, David R O'Hallaron, # #################################################################### # ################## #################################################################### # ################## # C Include Nu se schimba # #################################################################### # ################## ' "isa h"' "pipeline h' "stages h"' "sim h"' quote '#include quote '#include quote '#include quote '#include quote '#include cita 'int sim main(int argc, char *argv[]);' cita 'int main(int argc, char *argv[]){return sim main(argc,argv);}' #################################################################### # ################## # Reclame Nu modifica/muta/sterge # #################################################################### # ################## coduri de comandă Y ############## ##### Simbolic performanţă intig INOP „I NOP” intig IHALT 'I HALT' intsig IRRMOVL 'I -RRMOVL intsig IIRMOVL 'I -IRMOVL intig IRMMOVL 'I -RMMOVL intsig IMRMOVL 'I -MRMOVL intig IOPL 'I ALU' intig IJXX -JMP' intig ICALL 'I -CALL' intig IRET 'I RET' intig IPUSHL 'I -PUSHL' intig IPOPL 'I -POPL' ##### Simbolic reprezentarea referințelor explicite ##### intig RESP „REG ESP” intig RNONE „REG NONE” registrele Y , care sunt realizate # Indicator de stivă # Valoare specială care indică lipsa majusculei ##### Funcțiile ALU menționate în mod explicit ################# intsig ALUADD 'A ADD' # ALU trebuie să adauge argumentele lor Anexa cincizeci ##### Semnale care pot fi accesate prin logica de control ######## ##### Registrul conductei F ######################################### intig F predPC 'pc curr->pc' # Valoarea RS estimată ##### Valori intermediare în etapa de eșantionare ###################### intig f icode ' if id next->icode' # Codul de comandă selectat intsig f ifun 'if id next->ifun' # Funcția de comandă selectată intig f valC 'if id next->valc* # Date constante ale selectatei comenzi intig f valP ' if id next->valp* # Adresa următoarei comenzi ##### Pipeline Register D ####################################### intsig D icode ' if id curr->icode' # Cod de comandă intig D rA 'if id curr->ra' # rA câmp de la comandă intig D rB ' if id curr->rb' # Curr câmp de la comandă intsig D valP ' if id curr->valp* # Număr de program incrementat ##### Valori intermediare în timpul pasului de decodificare ################### intsig d srcA ' id ex next->srca' # srcA din comanda decodificată intsig d srcB intsig d rvalA 'id ex next->srcb' # srcB din comanda decodificată 'd regvala' # Citiți valA din fișierul de registru intsig d rvalB 'd regvalb' # Citiți vaiva din fișierul de înregistrare ##### Registrul conductei E ######################################### intsig intsig intsig intsig intsig intsig intsig intsig intig E icode E ifun E valC E srcA E valA E srcB E valB E dstE E dstM ' id ex curr->icode' 'id ex curr->ifun' 'id ex curr->valc' 'id ex curr->srca' ' id ex curr->vala ' 'id ex curr->srcb' 'id ex curr->valb' 'id ex curr->deste' 'id ex curr->destm' # Cod de comandă # funcția de comandă # Date constante # ID-ul de înregistrare al sursei A # Valoare Sursă A # ID registru sursă B # Valoarea sursei B # Identificatorul registrului de destinație E # Identificatorul registrului de destinație M Descrierea logicii de control a procesoarelor care folosesc HCL ##### Valori intermediare de rulare #################### intsig e valE ' ex mem next->vale' # vaIE generat de ALU boolsig e Bch 'ex mem next->takebranch' # Sunteți gata să vă ramificați? ##### Registrul transportor M ##### intsig M icode 'ex mem curr->icode' # Cod de comandă intsig M ifun 'ex mem curr->ifun' # Funcția de comandă intsig M valA 'ex mem curr->vala' # Sursă A valoare intsig M dstE 'ex mem curr->deste # Identificator de registru de destinație E intig M valE 'ex mem curr->vale' # ALU value E intsig M dstM ' ex mem curr->destm' # Identificator registru destinație M boolsig M Bch 'ex mem curr->takebranch ' # Flag al ramurii selectate ##### Valori intermediare în pasul de memorie ###################### intsig m valM 'mem wb next->valm' # vaim generat de memorie ##### Pipeline Register W ######################################### intig W icode 'mem wb curr->icode' # Cod de comandă intig W dstE 'mem wb curr->deste' # ID registru destinație E intig W valE 'mem wb curr->vale' # Valoarea ALU E intsig W dstM ' mem wb curr->destm' # Identificator registru destinație M intig W valM ' mem wb curr->valm' # Valoare de memorie M #################################################################### # ################## # Definițiile semnalului de control # #################################################################### # ################## ################ Etapa de eșantionare ############################## # ## ## La ce adresă ar trebui preluată comanda? int f pc = [ # Ramura estimată greșit Probă pe număr de program incrementat M icode = IJXX && !M Bch : M valA; # Terminarea comenzii RET W icode = IRET : W valM; # Implicit: utilizați contorul de program incrementat : F predPC; ]; Anexa • # Comanda selectată necesită octeți regid? bool need regids = f icode în { IRRMOVL, IOPL, IPUSHL, IPOPL, IIRMOVL, IRMMOVL, IMRMOVL}; # Comanda selectată necesită un cuvânt constant? bool nevoie-valC = f icode în { IIRMOVL, IRMMOVL, IMRMOVL, IJXX, ICALL }; bool instr valid = f icode in { INOP, IHALT, IRRMOVL, IIRMOVL, IRMMOVL, IMRMOVL, IOPL, IJXX, ICALL, IRET, IPUSHL, IPOPL}; # Preziceți următoarea valoare a contorului programului int new F predPC = [ f icode în { IJXX, ICALL } : f valC; : f-vaIP; ]; ################ Pasul de decodare ############################## # ### ## Ce registru ar trebui folosit ca sursă A? int new-E srcA = [ D icode în { IRRMOVL, IRMMOVL, IOPL, IPUSHL } : D rA; D icode în { IPOPL, IRET } : RESP; : RNONE; # Înregistrarea nu este necesară ]; ## Ce registru ar trebui folosit ca sursă B? int new E srcB = [ D icode în { IOPL, IRMMOVL, IMRMOVL } : D rB; D icode în { IPUSHL, IPOPL, ICALL, IRET } : RESP; : RNONE; # Înregistrarea nu este necesară ]; ## Ce registru ar trebui folosit ca destinație E? int new E dstE = [ D icode în { IRRMOVL, IIRMOVL, IOPL} : D rB; D-icode în { IPUSHL, IPOPL, ICALL, IRET } : RESP; : RNONE; # Înregistrarea nu este necesară ]; Descrierea logicii de control a procesoarelor care folosesc HCL de înregistrări ## Ce registru ar trebui folosit ca destinație M? int new E dstM = [ D icode în { IMRMOVL, IPOPL } : D rA; : RNONE; # Înregistrarea nu este necesară ]; ## Care ar trebui să fie valoarea lui A? ## Treceți la pasul de decodare pentru vaia int new E valA = [ D icode în { ; EU CHEM, IJXX } : : Dj ralP; # Utilizare contor de programe incrementat d srcA == E dstE : e valE; # Transferați vaIE din stadiul de memorie d srcA M dstM : m valM; # Trecerea valM din memorie d srcA == M dstE : M valE; # Transferați vaie din memorie d srcA = w dstM : W valM; # Trimite vaim de pe revers înregistrări d srcA == w dstE : W valE; # Trecerea vaie de pe revers înregistrări : dj rvalA; # Utilizați valoarea citită din fișierul registru ]; int new E valB = [ d srcB E dstE : e valE; # Trecerea vaie de pe scenă împlinire d srcB M dstM : m valM; # Transferați vaim din stadiul de memorie d srcB == M dstE : M valE; # Transferați vaIE din stadiul de memorie d srcB = W dstM : W valM; # Trimite vaim de pe revers d srcB = W dstE : W valE; # Trecerea vaie de pe revers înregistrări : d rvalB; # Utilizați valoarea citită din fișierul de înregistrare ]; ################ Runtime ################################ #### ## Selectați datele de intrare A pe ALU int aluA = [ E icode în { IRRMOVL, IOPL } : E valA; E icode în { IIRMOVL, IRMMOVL, IMRMOVL } : E valC; E icode în { ICALL, IPUSHL } : - ; E icode în { IRET, IPOPL } : ; # Alte instrucțiuni nu necesită ALU Anexa ## Selectați datele de intrare B pe ALU int aluB = [ E icode în { IRMMOVL, IMRMOVL, IOPL, ICALL, IPUSHL, IRET, IPOPL } : E valB; E icocie în { IRRMOVL, IIRMOVL } : ; # Alte instrucțiuni nu necesită ALU ]; ## Setarea funcției ALU int alufun = [ E icode = IOPL : E ifun; : ALUDD; ]; ## Ar trebui actualizate codurile de stare? bool set cc = E icode = IOPL; ################ Etapa memoriei ################################ ###### ## Selectați adresa de memorie int mem addr = [ M icode în { IRMMOVL, IPUSHL, ICALL, IMRMOVL } : M valE; M icode în { IPOPL, IRET } : M valA; # Alte comenzi nu necesită o adresă ]; ## Setarea controlului semnalului de citire bool mem read = M icode în { IMRMOVL, IPOPL, IRET }; ## Setarea de control al semnalului de înregistrare bool mem write = M icode în { IRMMOVL, IPUSHL, ICALL }; ################ Controlul registrului transportorului #################### # Opriți sau introduceți cerc în registrul de conducte F? # Cel mult una dintre ele va fi adevărată bool F bubble = ; bool F stall = # Condiții de risc de descărcare/utilizare E icode în { IMRMOVL, IPOPL } && E dstM în { d srcA, d srcB } || # Opriți-vă la etapa de preluare în timp ce treceți ret prin conducta IRET în { D icode, E icode, M icode }; Descrierea logicii de control a procesoarelor care folosesc HCL # Opriți sau introduceți cerc în registrul de conducte D? # Cel mult unul dintre ele va fi adevărat bool D stall = # Condiții de risc de încărcare/utilizare E icode în { IMRMOVL, IPOPL } && E dstM în { d srcA, d srcB }; bool D bubble = # Ramura estimată greșit (E icode = IJXX && !e Bch) || # Opriți-vă la etapa de preluare în timp ce treceți ret prin conductă IRET în { D icode, E icode, M icode }; # Opriți sau introduceți cerc în registrul conductei E? # Cel mult una dintre ele va fi adevărată bool E stall = ; bool E bubble = # Ramura estimată greșit (E icode = IJXX && !e Bch) || # Condiții de risc de descărcare/utilizare E icode în { IMRMOVL, IPOPL } && E dstM în { d srcA, d srcB}; # Opriți sau introduceți cerc în registrul conductei M? # Cel mult una dintre ele va fi adevărată bool M stall = ; bool M bubble = ; ANEXA Eroare la procesare Programatorii ar trebui să verifice întotdeauna codurile de eroare returnate de funcțiile la nivel de sistem Este logic să folosiți doar informațiile de stare transmise programatorului de către nucleu Din păcate, dezvoltatorii neglijează adesea să-și verifice programele pentru erori, deoarece acesta aglomerează codul, transformând, de exemplu, o linie de cod într-o declarație condiționată cu mai multe linii Verificarea erorilor introduce, de asemenea, un anumit tip de confuzie în program, deoarece diferite funcții indică erorile în mod diferit În timpul scrierii cărții, autorii s-au confruntat cu probleme similare Pe de o parte, aș dori ca exemplele de cod să fie scurte și ușor de citit, iar pe de altă parte, nu ar trebui să răspândiți opinia falsă că nu trebuie să verificați deloc programul pentru erori Pentru a rezolva problemele conexe, a fost adoptat un principiu bazat pe programele de tratare a erorilor de interfață, propus pentru prima dată de W Richard Stevens în lucrarea sa despre programarea în rețea [ ] Ideea este că, dacă există o funcție foo definită la nivel de sistem, o funcție de interfață Foo este definită cu aceleași argumente Wrapper-ul apelează funcția principală și efectuează verificarea erorilor Dacă este detectată o eroare, împachetătorul tipări un mesaj informativ și întrerupe procesul În caz contrar, se întoarce la programul apelant Rețineți că, în absența erorilor, comportamentul wrapper-ului nu este diferit de comportamentul funcției principale În schimb, dacă un program rulează corect cu packeri, acesta va rula corect dacă introduceți prima literă a fiecărui pachet cu litere mici și recompilați Pachetele sunt combinate într-un singur fișier sursă (csapp c) compilat și încorporat în fiecare program Un fișier antet separat (csapp h) conține prototipuri de funcții pentru ambalatori Această anexă oferă tutoriale despre diferitele tipuri de tratare a erorilor pe sistemele Unix, precum și exemple de diferite stiluri de programe de interfață de tratare a erorilor Pentru referință, aici sunt incluse și sursele complete pentru fișierele csapp h și csapp c Anexa Gestionarea erorilor pe un sistem Unix Există trei stiluri diferite de tratare a erorilor utilizate în apelurile de funcții la nivel de sistem pe care le veți întâlni în această carte: Unix, Posix și DNS Gestionarea erorilor în stilul Unix Funcții precum fork and wait, dezvoltate în primele zile ale sistemelor Unix (cum ar fi unele dintre funcțiile mai vechi Posix), supraîncărcă valoarea returnată a unei funcții cu coduri de eroare și rezultate utile De exemplu, când funcția Unix wait întâmpină o eroare (cum ar fi absența unui proces generat), returnează - și setează variabila globală egrpo la un cod de eroare care indică cauza erorii Dacă funcția de așteptare se finalizează cu succes, este returnat un rezultat util, care este ajustarea proporțională-integrală-derivată a procesului copil asamblat Codul de gestionare a erorilor în stil Unix este de obicei de forma: dacă ((pid = așteptați (NULL)) tfinclude tfinclude tfinclude #include tfinclude #include #include Anexa paisprezece cincisprezece optsprezece nouăsprezece douăzeci treizeci cincizeci #include #include #include #include #include #include #include #include #include #include #include ttinclude #include /* Permisiuni implicite pentru fișiere: DEF MODE și ~DEF^ UMASK */ #define DEF MODE S IRUSR I S IWUSR | S IRGRP I S IWGRp s IROTH | S IWOTH #define DEFJJMASK S IWGRP | S IWOTH /* Simplifica apelurile bind(), connect() și accept() */ typedef struct sockaddr SA; /* Blocaj pentru rafală I/O stabilă (RIO) */ #define RIO BUFSIZE typedef struct { int rio fd; /♦ handle la acest buffer intern */ int rio cnt; /* octeți necitiți în bufferul intern */ char *rio bufptr; /* următorul octet necitit */ char rio buf[RIO-BUFSIZE]; /* buffer intern */ }rio t; /* Variabile externe */ extern int h errno; /* definit de BIND pentru erori DNS */ extern char **environ; /* definit de libc */ /* Diverse constante */ #define MAXLINE /* lungimea maximă a unei linii de text */ #define MAXBUF /* dimensiunea maximă a tamponului I/O */ #define LISTENQ /* al doilea argument pentru a asculta() */ /* Funcții proprii de tratare a erorilor */ void unix error (char *msg); void posix error (cod int, char *msg); void dns error (char *msg); void app error (char *msg); Eroare la procesare /* Ambalaje pentru controlul procesului */ pid t Furcă (void); void Exe(const char *filename, char *const argv[], char *const envp[]); pid t Wait(int *status); pid t Waitpid(pid t pid, int *iptr, int opțiuni); void Kill(pid t pid, int signum); unsigned int Sleep(unsigned int secs); void Pauză(void); unsigned int Alarm (unsigned int secunde); void Setpgid(pid t pid, pid t pgid); pid t Getpgrp(); /* Învelișuri de semnal */ typedef void handler t (int) ; handler t *Signal(int signum, handler t *handler); void Sigprocmask(int how, const sigset t *set, sigset t *oldset); void Sigemptyset(sigset t *set); void Sigfillset(sigset t *set); void Sigaddset(sigset t *set, int signum); void Sigdelset(sigset t *set, int signum); int Sigismember(const sigset t *set, int signum); /* Unix I/O wrappers */ int Open(const char *pathname, int flags, mode t mode); ssiize t Read(int fd, void *buf, size t count); ssiize t Write(int fd, const void *buf, size t count); off t Lseek(int fildeș, off t offset, int wherece); void Close(int fd); int Select (int n, fd set *readfds, fd set *writefds, fd set *exceptfds, struct timeval *timeout); int Dup (int fdl, int fd ); void Stat(const char *filename, struct stat *buf); void Fstat(int fd, struct stat *buf); /* Aparate de cartografiere a memoriei ★/ void *Mmap(void *addr, size t len, int prot, int flags, int fd, off t offset); void Munmap(void *start, size t length); /* Wrapper I/O standard */ void Fclose(FILE *fp); FILE *Fdopen(int fd, const char *type); caracter *Fgets(char *ptr, int n, FILE *stream); FILE *Fopen(const char *filename, const char *mode); void Fputs(const char *ptr, FILE *stream); Anexa size t Fread(void *ptr, size t size, size t nmemb, FILE *stream); void Fwrite(const void *ptr, size t size, size t nmemb, FILE *stream); /* Alocatori dinamici de memorie */ void *Malloc(size t size); void *Realloc(void *ptr, size t size); void *Calloc(size t nmemb, size t size); void Free(void *ptr); /* Învelișuri de interfață socket */ \ int Socket (domeniu int, tip int, protocol int); void Setsockopt(int s, int level, int optname, const void *optval, int optlen); void Bind(int sockfd, struct sockaddr *my addr, int addrlen); void Listen(int s, int backlog); int Accept(int s, struct sockaddr *addr, int *addrlen); void Connect(int sockfd, struct sockaddr *serv addr, int addrlen); /* ambalaje DNS */ struct hostent *Gethostbyname(const char *nume); struct hostent *Gethostbyaddr(const char *addr, int len, int tip); /* Pthreads flow control wrappers */ void Pthread create(pthread t *tidp, pthread attr t *attrp, void * (*rutina)(void *), void *argp); void Pthread join(pthread ^t tid, void **thread return); void Pthread cancel(pthread t tid) ; void Pthread detach(pthread t tid); void Pthread exit(void *retval); pthread t Pthread self(void); void Pthread once(pthread once t *once control, void (*init function)()); /* Învelișuri semafor POSIX */ void Sem init(sem t *sem, int pshared, unsigned int valoare); void P(sem t *sem) ; void V(sem t *sem) ; /* Pachetul Rio (I/O persistent) */ ssize t rio readn(int fd, void *usrbuf, size t n); ssiize t rio writen(int fd, void *usrbuf, size t n); void rio readinitb(rio t *rp, int fd); ssiize t rio readnb(rio t *rp, void *usrbuf, size t n); ssiize t rio readlineb(rio t *rp, void *usrbuf, size t maxlen); Eroare la procesare /* Ambalatori pentru pachetul Rio */ ssiize t Rio readn(int fd, void *usrbuf, size t n); void Rio writen(int fd, void *usrbuf, size t n); void Rio readinitb(rio t *rp, int fd); ssiize t Rio readnb(rio t *rp, void *usrbuf, size t n); ssiize t Rio readlineb(rio t *rp, void *usrbuf, size t maxlen); /★ Funcțiile sistemului de ajutor pentru client/server */ int open clientfd(char *hostname, int portno); int open listenfd(int portno); /* Ambalatori pentru funcția de ajutor client/server */ int Open clientfd(char *nume gazdă, port int); int Open listenfd(int port); #endif /* CSAPP H */ fișier sursă csapp c #include „csapp h” /★***★*★★★★★**★★**★★★★***** * Funcții de tratare a erorilor * + + + + / void unix error(char *msg) /* Eroare de stil Unix */ { fprintf(stderr, "%s: %s\n", msg, strerror(errno)); ieșire( ); } unsprezece void posix error(int code, char *msg) /* Eroare de stil Posix */ ' { fprintf(stderr, „%s: %s\n”, msg, strerror(cod)); ieșire( ); } void dns error(char *msg) /* Eroare de stil DNS */ nouăsprezece { fprintf(stderr, „%s: eroare DNS %d\n”, msg, h errno); ieșire( ); } void app error(char *msg) /* eroare aplicație */ { fprintf(stderr, „%s\n”, msg); Anexa treizeci cincizeci • ieșire( ); } /★★★★★★★★★★★★★★★★★★★*★★★*★★★+★★★★★★★★★★★★★■*■★⅘★★★ * Ambalatori pentru funcțiile de control al proceselor Unix ★★★★★★★★★★★★★★★★★★★★★★★★★★★★*★+★*★★★★★★★★★★⅘★★ pid t Furcă (void) { pid t pid; dacă ((pid = furcă ()) ) { if ((nread = read(fd, buff, nleft)) = */ } /* * rio writen - scrie n octeți în mod persistent (fără tampon) */ ssiize t rio writen(int fd, void *usrbuf, size t n) { size t nleft = n; ssiize t nscris; char *bufp = usrbuf; în timp ce (nstânga > ) { if ((nwritten = write(fd, buff, nleft)) rio cnt rio cnt = read(rp->rio fd, rp->rio buf, sizeof(rp->rio buf)); dacă (rp->rio cnt rio cnt = ) /* EOF */ return ; altfel rp->rio bufptr = rp->rio buf; /* reîncărcați tamponul ptr */ } /* Copiați cel puțin (n, rp->rio cnt) octeți din bufferul intern către bufferul utilizatorului */ cnt în n; dacă (rp->rio cnt rio cnt; memcpy(usrbuf, rp->rio bufptr, cnt); rp->rio bufptr += cnt; rp->rio cnt -= cnt; return cnt; } /* * rio readinitb - legați mânerul pentru citirea tamponului și reîncărcarea tamponului */ void rio readinitb (rio t *rp, int fd) { rp->rio fd = fd; rp->rio cnt = ; rp->rio bufptr = rp->rio buf; } /* * rio readnb - Citiți robust n octeți (buffered) */ ssiize t rio readnb(rio t *rp, void *usrbuf, size t n) { size t nleft = n; ssiize tnread; char *bufp = usrbuf; în timp ce (nstânga > ) { if ((nread = rio read(rp, buff, nleft)) = */ } /* * rio readlineb - citiți robust o linie de text (buffered) */ ssiize t rio readlineb(rio t *rp, void *usrbuf, size t maxlen) int n, rc; char c, *bufp = usrbuf; pentru (n = ; n * și returnează un descriptor de socket pentru citire și scriere * Returnați -І și setați egpo pe eroarea Unix * Returnați - și setați h errno la o eroare DNS (gethostbyname) */ int open clientfd(char *nume gazdă, int port) { int clientfd; struct host *hp; struct sockaddr in serveraddr; if ((clientfd = socket(AF INET, SOCK STREAM, )) h addr, (char *)&serveraddr sin addr s addr, hp->h length); serveraddr sin port = htons(port); /* Stabilește o conexiune la server */ if (connect(clientfd, (SA *) &serveraddr, sizeof(serveraddr)) < ) returnează - ; return clientfd; } /* * open listenfd - deschide și returnează un soclu de ascultare pe un port * Returnați -I și setați egpo pe eroarea Unix */ int open listenfd(int port) { int listenfd, optval=l; struct sockaddr in serveraddr; /* Creați un descriptor de socket */ dacă ((listenfd = socket(AF INET, SOCK STREAM, )) < ) întoarcere - ; /* Eliminați eroarea „Adresa deja în uz” din legare */ dacă (setsockopt (ascultăfd, SOL SOCKET, SO REUSEADDR, (const void *)&optval, sizeof(int)) < ) întoarcere - ; /* Listenfd va fi un punct final de port pe orice adresă IP */ bzero((car *) &serveraddr, sizeof(serveraddr)); serveraddr sin f amil y = AF INET; serveraddr sin addr s addr = htonl(INADDR ANY) ; serveraddr sin port = htons((unsigned short)port); if (bind(listenfd, (SA *)&serveraddr, sizeof(serveraddr)) < ) returnează - ; /♦ Pregătiți soclul pentru a accepta cererile de conectare */ dacă (ascultă(ascultăfd, LISTENQ) < ) Anexa întoarcere - ; return listenfd; } /*★****★***★*★****★** *-******************************** * * Pachete pentru rutine de ajutor client/server ★★★***★★★***★***★★***★★****★★*****★★****★*★★**★★/ int Open clientfd(char *nume gazdă, port int) { int rc; if ((rc = open clientfd(hostname, port)) < ) { dacă (rc = - ) unix error(„Eroare Unix Open clientfd”); * altfel dns error ("Eroare DNS Open clientfd"); } return rc; } int Open listenfd(int port) { int rc; dacă ((rc = open listenfd(port)) < ) unix error(''Eroare Open listenfd''); retur rc; } Bibliografie K Amold și J Gosling Limbajul de programare Java Addison-Wesley, V Bala, E Duesterwald si S Banerjiia Dynamo: Un sistem transparent de optimizare dinamică În Proceedings of the ACM Conference on Programming Language Design and Implementation (PLDI), - , iunie T Bemers-Lee, R Fielding și H Frystyk Protocol de transfer hipertext - HTTP/ RFC , A Birrell O introducere în programarea cu fire Raport tehnic , Centrul de Cercetare în Sisteme Digitale, F P Brooks, Jr Omul mitic-luna, ediția a doua Addison-Wesley, A Demke Brown și T Mowry Îmblanzirea porcilor de memorie: Utilizarea versiunilor introduse de compilator pentru a gestiona memoria fizică în mod inteligent În Proceedings of the Fourth Symposium on Operating Systems Design and Implementation (OSDI), paginile - , octombrie RE Bryant și DR O'Hallaron Introducerea sistemelor informatice din perspectiva unui programator În Proceedings of the Technical Symposium on Computer Science Education (SIGCSE), ACM, februarie B R Buck și J K Hollingsworth Un AP pentru corecția codului de rulare Journal of High Performance Computing Applications, ( ): - , iunie D Butenhof Programare cu fire Posix Addison-Wesley, S Carson și P Reynolds Geometria programelor semaforice Tranzacții ACM pe limbaje și sisteme de programare, ( ): - , JB Carter, WC Hsieh, LB Stoller, MR Swanson, L Zhang, EL Brunvand, A Davis, C -C Kuo, R Kuramkote, MA Parker, L Schaelicke și T Tateyama Impuls: Construirea unui controler de memorie mai inteligent În Proceedings of the Fifth International Symposium on High Performance Computer Architecture (HPCA), paginile - , ianuarie P Chen, E Lee, G Gibson, R Katz și D Patterson RAID: stocare secundară de înaltă performanță, fiabilă ACM Computing Surveys, ( ), iunie Bibliografie S Chen, P Gibbons și T Mowry Îmbunătățirea performanței indexului prin preluare prealabilă În Proceedings of the ACM S GMOD Conference ACM, mai T Chilimbi, M Hill și J Larus aspectul structurii conștient de cache În Proceedings of the ACM Conference on Programming Language Design and Implementation (PLDI), paginile - ACM, mai B Cmelik și D Keppel Shade: Un simulator rapid de set de instrucțiuni pentru profilarea execuției În Proceedings of the ACM SIGMETR CS Conference on Measurement and Modeling of Computer Systems, pages - , May E Coffman, M Elphick și A Shoshani blocaje ale sistemului ACM Computing Surveys, ( ): - , iunie Danny Coheft Despre războaiele sfinte și o pledoarie pentru pace IEEE Computer, ( ): - , octombrie Intel Corp Intel Architecture Software Developer's Manual, Volume : Basic Architecture, Numărul de comandă De asemenea, disponibil la http://developer intel com/ Intel Corp Intel Architecture Software Developer's Manual, Volume : Instruction Set Reference, Numărul de comandă De asemenea, disponibil la http://developer intel com/ C Cowan, P Wagle, C Pu, S Beattie și J Walpole Buffer overflows: Atacuri și apărări pentru vulnerabilitatea deceniului În DARPA Information Survivability Conference and Expo (DISCEX), martie John H Crawford CPU I : Executarea instrucțiunilor într-un singur ciclu de ceas IEEE Micro, (l): - , februarie V Cuppu, B Jacob, B Davis și T Mudge O comparație de performanță a arhitecturilor DRAM contemporane În Proceedings of the Twenty-Sixth Internațional Sympo-sium on Computer Architecture (ISCA), Atlanta, GA, mai IEEE B Davis, B Jacob și T Mudge Noile interfețe DRAM: SDRAM, RDRAM și variante În Proceedings of the Third International Symposium on High Performance Computing (ISHPC), Tokyo, Japonia, octombrie EW Dijkstra Procese secvențiale cooperante Raport tehnic EWD- , Universitatea Tehnologică, Eindhoven, Țările de Jos, C Ding și K Kennedy Îmbunătățirea performanței cache-ului aplicațiilor dinamice prin reorganizări de date și de calcul în timpul execuției În Proceedings of the ACM Conference on Programming Language Design and Implementation (PLDI), paginile - ACM, mai M W Eichen și J A Rochlis Cu microscop și pensetă: O analiză a virusului Internet din noiembrie InlEEESymposium on Research in Security and Privacy, R Fielding, J Gettys, J Mogul, H Frystyk, L Masinter, P Leach și T Berners-Lee Protocol de transfer hipertext - HTTP/ RFC , Bibliografie G Gibson, D Nagle, K Amiri, J Butler, F Chang, H Gobioff, C Hardin, E Riedel, D Rochberg și J Zelenka O arhitectură de stocare rentabilă, cu lățime de bandă mare În lucrările Conferinței Internaționale privind suportul arhitectural pentru limbaje de programare și sisteme de operare (ASPLOS) ACM, octombrie G Gibson și R Van Meter Arhitectură de stocare atașată la rețea Comunicări ale ACM, ( ), noiembrie L Gwennap Intel P folosește un design superscalar decuplat Microprocessor Report, ( ), februarie L Gwennap Noul algoritm îmbunătățește predicția ramurilor Microprocessor Report, ( ), martie S P Harbison și G L Steele, Jr C, Un manual de referință Prentice Hali, JL Hennessy și D A Patterson Arhitectura calculatoarelor: o abordare cantitativă, ediția a treia Morgan-Kaufmann, San Francisco, CAR Hoare Monitoare: un concept de structurare a sistemului de operare Communications of the ACM, ( ): - , octombrie Intel Standarde de interfață pentru instrumente Portable Formats Specification, Versiunea , Număr de comandă De asemenea, disponibil la http://developer intel com/ F Jones, B Prince, R Norwood, J Hartigan, W Vogley, C Hart și D Bondurant O nouă eră a RAM-urilor dinamice rapide IEEE Spectrum, paginile - , octombrie R Jones și R Lins Garbage Collection: algoritmi pentru gestionarea automată dinamică a memoriei Wiley, M Kaashoek, D Engler, G Ganger, H Briceo, R Hunt, D Maziers, T Pinckney, R Grimm, J Jannotti și K MacKenzie Performanța și flexibilitatea aplicațiilor pe sistemele Exokernel În Proceedings of the Sixteenth Symposium on Operating System Principles (SOSP), octombrie R Katz Design logic contemporan Addison-Wesley, B Kemighan și D Ritchie Limbajul de programare C, ediția a doua Prentice Hali, BW Kemighan și R Pike Practica programarii Addison-Wesley, T Kilbum, B Edwards, M Lanigan și F Sumner Sistem de stocare pe un singur nivel IRE Transactions on Electronic Computers, EC- : - , aprilie D Knuth Arta programarii computerelor, Volumul : Algoritmi fundamentale, Ediția a doua Addison-Wesley, J Kurose și K Ross Rețele de calculatoare: o abordare de sus în jos cu internet Addison-Wesley, M Lam, E Rothberg și M Wolf Performanța cache-ului și optimizările algoritmilor blocați În lucrările Conferinței Internaționale privind suportul arhitectural pentru limbaje de programare și sisteme de operare (ASPLOS) ACM, aprilie Bibliografie JR Larus și E Schnarr EEL: Editare executabilă independentă de mașină În Proceedings of the ACM Conference on Programming Language Design and Implementation (PLDI), iunie JR Levine Legături și încărcătoare Morgan-Kaufmann, San Francisco, Y Lin şi D Padova Analiza compilatorului a acceselor neregulate la memorie În Proceedings of the ACM Conference on Programming Language Design and Implementation (PLDI), paginile - ACM, iunie JL Lions Eșecul zborului Ariane Raport tehnic, Agenția Spațială Europeană, iulie S Macguire Scrierea codului solid Microsoft Press, J Markoff Microsoft a fost prins în „trucuri murdare” împotriva AOL New York Times, august E Marshall Eroare fatală: cum Patriot a trecut cu vederea un Scud Science, pagina , martie J Morris, M Satyanarayanan, M Conner, J Howard, D Rosenthal și F Smith An-drew: Un mediu de calcul personal distribuit Comunicări ale ACM, martie T Mowry, M Lam și A Gupta Proiectarea și evaluarea unui algoritm compilator pentru preîncărcarea În Proceedings of the International Conference on Architectural Support for Programming Languages and Operating Systems (ASPLOS) ACM, octombrie SS Muchnick Proiectare și implementare avansată a compilatorului Morgan-Kaufmann, M Overton Calcul numeric cu IEEE Floating Point Arithmetic SI AM, D Patterson, G Gibson și R Katz Un caz pentru matrice redundante de discuri ieftine (RAID) În Proceedings of the ACM SIGMOD Conference ACM, iunie L Peterson și B Davies Rețele de calculatoare: o abordare de sistem, ediția a treia Morgan-Kaufmann, S Przybylski Cache și design ierarhic de memorie: Abordare direcționată pe performanță Morgan-Kaufmann, W Pugh Testul Omega: Un algoritm de programare cu numere întregi rapid și practic pentru analiza dependenței Comunicări ale ACM, ( ): - , august W Pugh Remedierea modelului de memorie Java În Proceedings of the Java Grande Conference, iunie J Rabaey Circuite integrate digitale: o perspectivă de proiectare Prentice Hali, D Ritchie Evoluția sistemului Unix de partajare a timpului AT&T Beli Laboratories Technical Journal, ( Part ): - , octombrie D Ritchie Dezvoltarea limbajului C În Proceedings of the Second History of Programming Languages Conference, Cambridge, MA, aprilie D Ritchie și K Thompson Sistemul de partajare a timpului Unix Communications of the ACM, ( ): - , iulie Bibliografie T Romer, G Voelker, D Lee, A Wolman, W Wong, H Levy, B Bershad și B Chen Instrumentarea și optimizarea executabilelor Win /Intel folosind Etch În Proceedings of the USENIX Windows NT Workshop, Seattle, Washington, august M Satyanarayanan, J Kistler, P Kumar, M Okasaki, E Siegel și D Steere Coda: Un sistem le foarte disponibil pentru un mediu de stație de lucru distribuită IEEE Transactions on Computers, ( ): - , aprilie J Schindler și G Ganger Caracterizare automată a unității de disc Raport tehnic CMU-CS- - , Scoala de Informatica, Universitatea Carnegie Mellon, B Shriver și B Smith Anatomia unui microprocesor de înaltă performanță: o perspectivă a sistemelor IEEE Computer Society, A Silberschatz şi P Galvin Concepte de sisteme de operare, ediția a cincea John Wiley & Sons, R Skeel Eroare de rotunjire și racheta Patriot SIAM News, ( ): , iulie A Smith memorie cache ACM Computing Surveys, ( ), septembrie EH Spafford Programul vierme Internet: o analiză Raport tehnic CSD-TR- , Departamentul de Informatică, Universitatea Purdue, A Srivastava şi A Eustace ATOM: Un sistem pentru construirea de instrumente personalizate de analiză a programelor În Proceedings of the ACM Conference on Programming Language Design and Implementation (PLDI), iunie W Stallings Sisteme de operare: principii interne și de proiectare, ediția a patra Prentice Hali, W Richard Stevens Programare avansată în mediul Unix Addison-Wesley, W Richard Stevens TCP/IP IHustrated: The Protocols, volumul Addison-Wesley, W Richard Stevens TCP/IP IHustrated: The Implementation, volumul Addison-Wesley, W Richard Stevens TCP/IP IHustrated: TCP pentru tranzacții, HTTP, NNTP și protocoalele de domeniu Unix, volumul Addison-Wesley, W Richard Stevens Unix Network Programming: Interprocess Communications, Ediția a doua, volumul Prentice Hali, W Richard Stevens Programare în rețea Unix: API-uri de rețea, ediția a doua, volumul Prentice Hali, T Stricker și T Gross Spațiu global de adrese, lățime de bandă neuniformă: O caracterizare a performanței sistemului de memorie a sistemelor paralele În Proceedings of the Third International Symposium on High Performance Computer Architecture (HPCA), paginile - , San Antonio, TX, februarie IEEE A Tannenbaum Sisteme de operare modem, ediția a doua Prentice Hali, A Tannenbaum Rețele de calculatoare, ediția a treia Prentice Hali, Bibliografie C R Wadleigh și I L Crawford Optimizare software pentru calcularea de înaltă performanță: crearea de aplicații mai rapide Prentice Hali, JF Wakerly Principii și practici de design digital, ediția a treia prencece hali, M V Wilkes Memorii slave și alocare dinamică de stocare IEEE Transactions on Electronic Computers, EC- ( ), aprilie P Wilson, M Johnstone, M Neely și D Boles Alocarea dinamică a spațiului de stocare: un sondaj și o revizuire critică În Internațional Workshop on Memory Management, Kinross, Scoția, M Wolf și M Lam Un algoritm de localitate a datelor În Conferința privind proiectarea și implementarea limbajului de programare (S GPLAN), paginile - , iunie J Wylie, M Bigrigg, J Strunk, G Ganger, H Kiliccote și P Khosla Sisteme de stocare a informaţiei supravieţuitoare IEEE Computer, august X Zhang, Z Wang, N Gloy, JB Chen și M D Smith Suport de sistem pentru profilare și optimizare automată În Proceedings of the Sixteenth ACM Symposium on Operating Systems Principles (SOSP), paginile - , octombrie Index de subiect ȘI Adresare absolută traducerea adresei Moduri de adresare Consultați Moduri de adresare Sarcina utilă agregată Bitul alocat Institutul Național American de Standarde cm ANSI Codul standard american pentru informații Schimb cm ASCII Andrewsen ANSI ASCII în BeliLabs Berkeley Software Distribution Berncrs-Lee Traducere binară Boles Brian Kernighan de ani Sistemul de prieteni Depășirea tamponului Buffer overflow bug c Apelat Vezi Programul Apelat Apelant Vezi steag de transport apelant Vezi CF Carson CAS Unitate centrală de procesare cm Procesor CF CISC, set de comenzi Ticurile ceasului Coalescent codul de mișcare COFF, format Coftinan Coloana Acces Strobe Cm CAS Timp de compilare Compilator Vezi compilator Driverul compilatorului Servere concurente Coprocesor Copiere la scriere CPE , , CP unitate CPU Vezi Unitatea centrală de procesare Cicluri pe element Vezi IPC D Datagramele DDR DRAM Cerere-zero pagini Dennis Ritchie Dijkstra , Dirty bit Pagina murdară Dezasamblator Vezi DLL de asamblare inversă DMA Vezi DNS DMA Sistem de denumire a domeniilor cm DNS Notație zecimală punctată DRAM Index de subiect Modul de memorie dual în linie Vezi DIMM Biblioteci de legături dinamice Alocarea memoriei dinamice Memorie dinamică cu acces aleatoriu cm DRAM E ECF EDO DRAM EEPROM adresa efectivă Vezi adresa executivului Punctul de intrare Portul efemer Segmentul Ethernet EU Debit de control excepțional Cm ECF Alocator explicit Codul de exploatare Precizie extinsă F Toamna prin Falsă fragmentare FIFO Fiat se adresează Unitate cu virgulă flotantă cm Cuvântul de stare în virgulă mobilă FPU FPM DRAM FPU Fragmentarea Indicator cadru Vezi indicatorul cadru Frederick Brooks G GAZ GDB Gene Amdahl Tabel offset global cm A PRIMIT simbol global Gordon Moore GOT GUI, interfața H Handler funcția Limbajul de control hardware, HCL Limba de descriere hardware HDL Heap , Hennesy HTTP Hub Protocol de transfer hipertext cm http IA arhitectura comanda procesor IA- CANN Organization CU ID grup de procese ID job Vedeți JID ID proces Vezi PID Alocator implicit Lista liberă implicită Intel Pentium Internet Software Consortium, Organizația Comunicare între procese A se vedea IPC Interval time IPC unitate ISA: model sistem de comandă J JID Iov Lista locurilor de muncă Joe Ossanna de ani Johnstone la Ken Thompson Kemel Modul Kemel Kilbum Knuth Index de subiect Ultimul intrat, primul ieşit Vezi LIFO Lawrence Roberts Legătura leneșă Levine Strategia LFU LIFO Spațiu de adrese liniar Linker Vezi editorul de linkuri Simbol local Localitatea Adresa de loopback LRU, strategie , M Marc Andreesen McCarthy Unitate de gestionare a memoriei cm MMU Maparea memoriei MIME Dimensiunea minimă a blocului Mockapetris Muchnick Extensii de poștă Internet multifuncțională Cm MIMA MUTua! EXCLUDEREA N Fundația Națională de Știință Cm NSF Organizația NCSA Neely NSF o Object dump Vezi Object Program Dump Fișierul obiect Modulul obiect p Captuseala Pagina Director Intrare cm PDF Eroare de pagină Cadre de pagină Pagina tabel Intrare în tabelul paginii Vezi PTE Pagina Patterson Paul Mockapetris Sarcina utilă PC Vezi contorul de programe PCI Relativ la PC PDE format PE Utilizare maximă Interconectarea componentelor periferice Cm PCI Adresa fizica cm PA spațiu de adrese fizice Pagini fizice Vezi PP PID TUBA-, transportor PLT Conexiune punct la punct Poluare Cod independent de poziție cm PIC POSIX standard Preprocesor Vezi preprocesor Privat Copiere privată la scriere Tabel de legătură cu procedurile Cm Identificator proces PLT Cm PID Contor de programe Vezi PC Blocul Prolog Lanțul proxy Przybylski PTE , Pthreading Pugh R RAS RDRAM Graficul accesibilității Memorie numai citire Cm ROM Reap Bit de referință Intrarea de relocare Răspunsul Adresa Retuni Vezi adresa de retur Inginerie inversă Consultați inginerie inversă Notație poloneză inversă cm RPN Index de subiect Reynoizi Richard Staltman Richard Stevens RISC: procesor set de comenzi Robert Kahn I/O robust Cm RIOROM Rând Acces Strobe Cm RAS RPN Timp de rulare s SDRAM Scction hcader table Seek Tabel antet segment Stocare Segrcgatcd Compilare separată SEQ: simulator procesor SEQ+, procesor Partajat Partajat agea Bibliotecă partajată Consultați Biblioteci partajate Modul de memorie inline unic cm SIMM Smith Gazdă sursă Spafford Procesor SPARC Cadru stivă Vezi cadru stivă Cod de pornire Bibliotecă statică Linker static Memorie statică cu acces aleatoriu cm SRAM Stevens Schimbare zonă Schimbare fișier Schimbare spațiu Schimbare' Ceas sistem Tel, limba test-expr Vezi condiția de continuare a buclei Lovitură Debit TID Tim Berners-Lee Tk, biblioteca TLB , , Urma Tranzacția Traducere Lookaside Buffer Cm TLB și Universal Rcsource Locator Cm URL Universal Serial Bus Cm URL USB , USB Modul utilizator V bitul valid VHDL Vinton Ceif Spațiu de adrese virtuale Adresare virtuală cm VA Mașină virtuală Memorie virtuală Vezi VM Pagini virtuale Vezi VP Virusul VM VRAM w W Richard Stevens , Wilkes Set de lucru Y , sistem de comandă Index de subiect ȘI Test automat CPU Adresa: Despre întoarcerea comenzi de atribuire Introducerea adresei Întreruperi hardware Unitate logică aritmetică Arhitectură: Compaq Alpha IA sarcină/storc Cod asamblare , B Registrul de bază Operații binare Bit de mod Optimization Blocker Descărcați blocarea Operație booleană Inel boolean Traducere rapidă a adreselor virtuale în Memoria virtuală spațiu de adrese virtuale Adrese virtuale Mașină virtuală Consultați Resincronizare mașină virtuală Timp de întârziere Inserarea registrelor de conducte Programul numit Denumită Procedura Apelant Procedura de apelare Alinierea datelor Generarea codului optimizat Nume globale Vezi Simbol global d Dump-ul programului obiect Optimizare pe două niveluri Descriptor de soclu Interval de adrese virtuale Memoria dinamică Vedeți Biblioteci legate în apropierea dinamic Vezi DLL Legea Emdal și Identificator: Procesul Vezi PID registru Expresii limbaj de asamblare Inițializarea buclei Utilizarea alias-urilor de memorie la Optimizarea codului Comanda: apoi tranziție , comparații în virgulă mobilă Compilatorul , Diagrama conductei Proiectarea benzii transportoare Registre transportoare , Procesor pipeline Comutator context , Restaurare configurație Cache: date echipe cartografiere directă -memorie l Linus Torvalds Operație logică „ȘI” Operație logică „XOR” Index de subiect Operație logică „NU” Flux logic Nume locale Vezi Simbol local Variabile de procedură locală m Apeluri lente de sistem Evitarea riscurilor Multitasking Aritmetică modulară Multiplexare I/O Multiplexor O Scopuri Gestionarea excepțiilor Handler de excepții Uniri Cod obiect Operații: scrieri citiri identități Optimizare compilator Pointer Eroare de pagină de disc P Memorie pentru stocarea datelor Mișcarea încărcăturii, tehnică Transferul datelor Fișiere obiect relocabile Capturarea unui semnal Imprimarea unui float Paginare Vedeți paginarea Înțelegerea concurenței Înregistrarea portului de scriere a fișierului Potențialul de calcul greșit de către conductă Curgere: pachet control Reprezentarea logicii de decodare Preprocesor Prefixul registrului conductei Indicatorul de transport Vezi CF Principiul conductei Programe: sinteza logica la nivelul mașinii Proiectul Multics Proiectarea registrului conductei Cache miss Acces direct la memorie Aliasuri de memorie Conducte în cinci etape R Desfăşurarea ciclului Biblioteci partajate , Fișiere obiect partajate Rezoluție link Dereferențiarea indicatorului Registrul cod de stare , Fișierul de înregistrare , , , Codare obișnuită Editarea linkurilor Linker Funcții de reintrare Risc de date cu Registre sincronizate Procesor Virtual Memory System Sistem de comandă Y Tip de date scalare Programe bazate pe evenimente Partajat Vezi Prize Berkeley partajate Valoarea contorului estimată Legătură: RIS la locația de memorie Standard ANSI C Fișierul bibliotecii statice Cadru stivuitor Paginare în memorie Index de subiect Strategii de predicție ale alegerii Structura: Despre PIPE- Despre hardware Despre multiplexor Procesoare superscalare Scripturi de testare, procesor Contor de programe , , t Corp: tratamente ciclu Urmărire Vezi urmă Blunt La Creșterea timpului de întârziere Indicator: teanc , cadru Operații unare Condiția de continuare a buclei Dispozitiv: finalizare Vezi UE operații în virgulă mobilă Vezi FPU generare de comandă Vezi CU f Fișier de schimb Vezi fișierul de schimb Adrese fizice Funcții la nivel de sistem c Cicluri pe element Vezi CPE uh Rescrierea pasului Procesor eficient pipeline eu Nucleul Unix Sisteme informatice ARHITECTURA SI PROGRAMARE „Materialul este acoperit în carte într-un mod ca nicăieri altundeva, dar în felul în care aș dori să susțin propriile mele prelegeri ” John Griner, Universitatea Rice „Acest proiect este unic în felul său și are toate șansele de a schimba radical principiile pedagogice din domeniul său ” Michael Scott, Universitatea din Rochester Randal E Bryant, Ph D , Profesor, Decan al Departamentului de Informatică de la Universitatea Carnegie Mellon (Pittsburgh) Autor a peste de lucrări tehnice Rezultatele cercetării profesorului Briaita sunt folosite de producători de calculatoare de top, inclusiv Intel, Motorola, IBM și Fujitsu Este laureat numeroase premii și premii Timp de de ani, R Bryant a predat cursuri despre arhitectura computerelor personale, algoritmi și programare David R O'Hallaron, Ph D , profesor la Departamentul de Informatică și Inginerie Electrică de la Universitatea Carnegie Mellon (Pittsburgh), unde predă cursuri de arhitectură computerizată, proiectare de procesoare paralele și multe altele A primit numeroase premii , inclusiv medalia Allen Newell (de la Universitatea Carnegie Mellon Theta) pentru contribuții excepționale la cercetarea pe computer De-a lungul multor ani de predare, Rs-ndal Bryant a ajuns la concluzia că programatorii pot dezvolta programe fiabile doar cu o mai bună înțelegere a întregului sistem informatic, prin care el nu se referă doar la „elementele arhitecturale standard”, cum ar fi procesorul central, memoria, porturi de intrare -ieșire etc , dar și sistemul de operare, compilatorul și mediul de rețea Împreună cu profesorul O'Hallaron, a dezvoltat cursul „Introduction to Computer Systems” care stă la baza acestei cărți și este predat la peste de universități din întreaga lume Cartea este destinată programatorilor care caută o înțelegere profundă a ceea ce se întâmplă „sub carcasa” unității de sistem atunci când execută aplicațiile pe care le-au scris Acest lucru permite, pe de o parte, dezvoltarea unui cod de program compact, fiabil și eficient, iar pe de altă parte, facilitează găsirea și eliminarea posibilelor erori în program Cartea acoperă: reprezentarea la nivel de mașină a datelor și a programelor, arhitectura procesorului, optimizarea programelor, legăturile, controlul firelor, gestionarea memoriei și memoriei virtuale, I/O la nivel de sistem, programare în rețea și paralelă Este descris modul în care aspectele de mai sus ar trebui să fie luate în considerare de către programator atunci când își dezvoltă propriile aplicații și sisteme De exemplu, atunci când descrieți stocarea în cache, luați în considerare modul în care bucla poate afecta performanța programului Fără a avea abilități de programare în limbaj de asamblare și limbaj C, puteți obține o înțelegere academică a regulilor de scriere a codului optim Exemplele introduse în carte pentru procesoare compatibile cu Intel (IA ) sunt scrise în C și rulează pe un sistem de operare Unix sau similar, cum ar fi Linux Un set complet de resurse, inclusiv laboratoare, fragmente de prelegeri și mostre de cod, este disponibil la www csapp c cmu edu BHV-Petersburg , Sankt Petersburg, st Yesenina, B E-mail: mail@bhv ru Internet: www bhv ru Tel/Fax: ( ) - *bhv